Загрузка страницы

Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс.

Процесс обучения представляется в виде игры агента со средой, в которой агент совершает действия, среда в ответ даёт премии, и агент должен корректировать свою стратегию принятия решений таким образом, чтобы максимизировать суммарную будущую премию. Задача имеет черты классификации и прогнозирования. В простейшем случае это задача выбора действия по накопленной статистике премий, называемая задачей о многоруком бандите. В более сложном случае на каждом шаге известно, в каком из состояний находится среда. Если состояние среды описывается вектором признаков, то для принятия решений возможно приспособить инкрементные методы классификации, а для оптимизации стратегии агента применять градиентные методы. Во всех случаях основным вопросом обучения с подкреплением остаётся компромисс «exploration-exploitation» между изучающими действиями и действиями, непосредственно нацеленными на получение премий.

Видео Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс. канала Компьютерные науки
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
2 мая 2020 г. 16:37:32
01:25:10
Другие видео канала
Машинное обучение. Логические методы классификации. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Логические методы классификации. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение с подкреплением. Лекция №1Машинное обучение с подкреплением. Лекция №1Машинное обучение. Байесовская классификация. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Байесовская классификация. К.В. Воронцов, Школа анализа данных, Яндекс.AlphaGoZero, policy gradients и вообще Deep Reinforcement Learning (перезалито)AlphaGoZero, policy gradients и вообще Deep Reinforcement Learning (перезалито)Машинное обучение. Нейронные сети и градиентные методы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Нейронные сети и градиентные методы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Рекомендательные системы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Рекомендательные системы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Нейронные сети глубокого обучения. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Нейронные сети глубокого обучения. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Композиции классификаторов, часть 2. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Композиции классификаторов, часть 2. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение и искусственный интеллектМашинное обучение и искусственный интеллектМашинное обучение. Линейные композиции, бустинг. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Линейные композиции, бустинг. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Линейные методы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Линейные методы. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Прогнозирование временных рядов. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Прогнозирование временных рядов. К.В. Воронцов, Школа анализа данных, Яндекс.001. Вводная лекция - К.В. Воронцов001. Вводная лекция - К.В. ВоронцовМашинное обучение. Поиск ассоциативных правил. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Поиск ассоциативных правил. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Критерии выбора моделей. К.В. Воронцов, Школа анализа данных,Яндекс.Машинное обучение. Критерии выбора моделей. К.В. Воронцов, Школа анализа данных,Яндекс.Машинное обучение с подкреплением. Лекция №2Машинное обучение с подкреплением. Лекция №2Машинное обучение. Тематическое моделирование. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Тематическое моделирование. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Активное обучение. К.В. Воронцов, Школа анализа данных, Яндекс.Машинное обучение. Активное обучение. К.В. Воронцов, Школа анализа данных, Яндекс.День открытых дверей в Школе анализа данных Яндекс 2019 - Прямая трансляцияДень открытых дверей в Школе анализа данных Яндекс 2019 - Прямая трансляция021. Обучение с подкреплением - К.В. Воронцов021. Обучение с подкреплением - К.В. Воронцов
Яндекс.Метрика