Все видео Новые видео Популярные видео Категории видео

Авто	Видео-блоги	ДТП, аварии	Для маленьких	Еда, напитки
Животные	Закон и право	Знаменитости	Игры	Искусство
Комедии	Красота, мода	Кулинария, рецепты	Люди	Мото
Музыка	Мультфильмы	Наука, технологии	Новости	Образование
Политика	Праздники	Приколы	Природа	Происшествия
Путешествия	Развлечения	Ржач	Семья	Сериалы
Спорт	Стиль жизни	ТВ передачи	Танцы	Технологии
Товары	Ужасы	Фильмы	Шоу-бизнес	Юмор

Введение в обучение с подкреплением в MATLAB (reinforcement learning)

Файлы вебинара лежат здесь (требуется регистрация)
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892

00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение

Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.

Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.

Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:

Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:

Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:

Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.

По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892

#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления

Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) канала MATLABinRussia

Показать

Комментарии отсутствуют