Загрузка страницы

P. Richtárik "Distributed Second Order Methods with Fast Rates and Compressed Communication"

Общероссийский семинар по оптимизации
7 апреля 2021 г. 17:30, Москва, Онлайн

P. Richtárik "Distributed Second Order Methods with Fast Rates and Compressed Communication"

Аннотация: We develop several new communication-efficient second-order methods for distributed optimization. Our first method, NEWTON-STAR, is a variant of Newton's method from which it inherits its fast local quadratic rate. However, unlike Newton's method, NEWTON-STAR enjoys the same per iteration communication cost as gradient descent. While this method is impractical as it relies on the use of certain unknown parameters characterizing the Hessian of the objective function at the optimum, it serves as the starting point which enables us design practical variants thereof with strong theoretical guarantees. In particular, we design a stochastic sparsification strategy for learning the unknown parameters in an iterative fashion in a communication efficient manner. Applying this strategy to NEWTON-STAR leads to our next method, NEWTON-LEARN, for which we prove local linear and superlinear rates independent of the condition number. When applicable, this method can have dramatically superior convergence behavior when compared to state-of-the-art methods. Finally, we develop a globalization strategy using cubic regularization which leads to our next method, CUBIC-NEWTON-LEARN, for which we prove global sublinear and linear convergence rates, and a fast superlinear rate. Our results are supported with experimental results on real datasets, and show several orders of magnitude improvement on baseline and state-of-the-art methods in terms of communication complexity.

http://www.mathnet.ru/php/seminars.phtml?option_lang=rus&presentid=29714

Видео P. Richtárik "Distributed Second Order Methods with Fast Rates and Compressed Communication" канала Optimization and Statistics in MIPT
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
20 апреля 2021 г. 15:06:31
01:24:25
Другие видео канала
Михаил Белкин "Optimization for over-parameterized systems and transition to linearity in  DL"Михаил Белкин "Optimization for over-parameterized systems and transition to linearity in DL"ORIE Colloquium on 11/24/2020: Stephen J  Wright (University of Wisconsin)ORIE Colloquium on 11/24/2020: Stephen J Wright (University of Wisconsin)Ю. Малицкий "Методы с редукцией дисперсии для вариационных неравенств"Ю. Малицкий "Методы с редукцией дисперсии для вариационных неравенств"A. Taylor. A few constructive approaches to optimal first-order optimization methods in cvx. opt.A. Taylor. A few constructive approaches to optimal first-order optimization methods in cvx. opt.Гасников А.В. Мини-курс по оптимизации в Сириусе. "УМ и его приложения", лекция 3.Гасников А.В. Мини-курс по оптимизации в Сириусе. "УМ и его приложения", лекция 3.А. В. Гасников. Распределенные алгоритмы решения задач оптимизации, приходящих из анализа данных.А. В. Гасников. Распределенные алгоритмы решения задач оптимизации, приходящих из анализа данных.S. Stich "Decentralized Deep Learning on Heterogeneous Data"S. Stich "Decentralized Deep Learning on Heterogeneous Data"E. Burnaev Generative Modeling based on Deep Neural Networks and Optimal TransportE. Burnaev Generative Modeling based on Deep Neural Networks and Optimal TransportМатематическое моделирование транспортных потоков 2021. Лекция 1 Модель БэкманаМатематическое моделирование транспортных потоков 2021. Лекция 1 Модель БэкманаB. Mordukhovich "Generalized Newton Methods via Variational Analysis"B. Mordukhovich "Generalized Newton Methods via Variational Analysis"Математическое моделирование транспортных потоков. Лекция 2. Модель Нестерова-деПальмыМатематическое моделирование транспортных потоков. Лекция 2. Модель Нестерова-деПальмыН. Тупица "Методы решения задач, допускающих альтернированную минимизацию"Н. Тупица "Методы решения задач, допускающих альтернированную минимизацию"Лекция 2 В.И. Швецова "Введение в прогнозирование транспортных потоков"Лекция 2 В.И. Швецова "Введение в прогнозирование транспортных потоков"Математическое моделирование транспортных потоков 2021. Лекция 4 Двухстадийная модельМатематическое моделирование транспортных потоков 2021. Лекция 4 Двухстадийная модельАлексей Окунев (СколТех) "Коллективный нейродинамический подход к задачам глобальной оптимизации"Алексей Окунев (СколТех) "Коллективный нейродинамический подход к задачам глобальной оптимизации"Э. А. Горбунов Extragradient Method: O(1/K) Last-Iterate Convergence for Monotone VIЭ. А. Горбунов Extragradient Method: O(1/K) Last-Iterate Convergence for Monotone VIO.O.Khamisov "Distributed optimization with linear inequality constraints via problem reformulation"O.O.Khamisov "Distributed optimization with linear inequality constraints via problem reformulation"Marty Lobdell - Study Less Study SmartMarty Lobdell - Study Less Study Smart1. Introduction to Human Behavioral Biology1. Introduction to Human Behavioral BiologyiPhone 1 - Steve Jobs MacWorld keynote in 2007 - Full Presentation, 80 minsiPhone 1 - Steve Jobs MacWorld keynote in 2007 - Full Presentation, 80 mins
Яндекс.Метрика