Введение в обучение с подкреплением в MATLAB (reinforcement learning)
Файлы вебинара лежат здесь (требуется регистрация)
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение
Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.
Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.
Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:
Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:
Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:
Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.
По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
Все видео на тему глубокого обучения и описание https://exponenta.ru/news/deep-learning-video
Подробнее о глубоком обучении https://exponenta.ru/ai
Наш тренинг "Глубокое обучение в MATLAB" https://exponenta.ru/MLDL
Deep Learning Toolbox https://exponenta.ru/neural-network-toolbox
Подписывайтесь на наш канал, чтобы не пропустить продолжение.
Мы в соцсетях:
FACEBOOK ‣ https://www.facebook.com/Matlab.Russia
VK ‣ https://vk.com/mathworks
INSTAGRAM ‣ https://www.instagram.com/matlab_russia
Telegram ‣ https://t.me/exponenta_ru
#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления
Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) автора ЦИТМ Экспонента
Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) автора ЦИТМ Экспонента
Информация
19 апреля 2022 г. 8:10:09
00:48:16
Похожие видео