Загрузка страницы

Введение в обучение с подкреплением в MATLAB (reinforcement learning)

Файлы вебинара лежат здесь (требуется регистрация)
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892

00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение

Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.

Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.

Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:

Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:

Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:

Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.

По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892

#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления

Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) канала MATLABinRussia
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
29 января 2020 г. 16:41:18
00:48:17
Яндекс.Метрика