Введение в обучение с подкреплением в MATLAB (reinforcement learning)
Файлы вебинара лежат здесь (требуется регистрация)
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение
Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.
Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.
Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:
Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:
Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:
Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.
По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления
Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) канала MATLABinRussia
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
00:00 Введение
00:37 Что такое «Обучение с подкреплением»
11:34 Обучение с подкреплением»: базовые идеи и терминология
22:35 Q Learning
31:12 Deep Q Learning
39:00 Рабочий процесс
44:51 Заключение
Обучение с подкреплением - технология, которая становится все более популярной в последнее время. Это связано с переходом алгоритмов обучения с подкреплением на нейросетевые подходы. В вебинаре "Введение в обучение с подкреплением с MATLAB" мы рассмотрели базовые принципы этого перехода.
Обучение с подкреплением — область исследований, которая была создана для решения задач оптимального управления, в связи с развитием и применением методов глубокого обучения приобретающая все большую популярность в последнее время.
Применение подхода глубокого обучения к этой области исследований позволяет решать задачи, которые раньше считались неразрешимыми.
Алгоритмы из этой области применяются во многих отраслях науки и техники, где используются сложные системы принятия решений и классические алгоритмы не находят оптимальных решений или находят их за неприемлемо большой промежуток времени, таких как:
Робототехника;
Беспилотные автомобили;
Оптимальное управление;
Маркетинг;
Финансы (трейдинг).
Данный вебинар посвящён введению в тему обучения с подкреплением. Мы рассмотрим общий подход в этой области исследований, а для того, чтобы материал был доступен и понятен — продемонстрируем несколько примеров применения алгоритмов обучения с подкреплением.
Основные темы вебинара:
Что такое обучение с подкреплением;
Общий рабочий процесс обучения с подкреплением;
Терминология области исследований;
Создание MATLAB/Simulink среды (Environment);
Определение политики и функции стоимости (policy and value function);
Создание агента (agent);
Обучение и валидация агента;
Генерация кода.
Вебинар будет полезен для специалистов в следующих областях:
Системы управления;
Анализ данных;
Финансовая аналитика;
Разработка систем принятия решений в ситуациях большой неопределенности.
По ссылке вы можете скачать файлы и ссылки на примеры к документации, которые использовались в вебинаре. В ближайшее время мы начнем цикл роликов по обучению с подкреплением, чтобы более плотно раскрыть эту тематику.
https://hub.exponenta.ru/post/vebinar-vvedenie-v-obuchenie-s-podkrepleniem-s-matlab892
#deep_learning #reinforcement_learning #обучение_с_подкреплением #глубокое_обучение #системы_управления
Видео Введение в обучение с подкреплением в MATLAB (reinforcement learning) канала MATLABinRussia
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
![Reinforcement Learning 01: Introduzione al Q-Learning](https://i.ytimg.com/vi/zioUP6Rxhw0/default.jpg)
![MATLAB в образовании](https://i.ytimg.com/vi/YOyLmbkKUaE/default.jpg)
![Occupancy Grid - 5 Minutes with Cyrill](https://i.ytimg.com/vi/8ckhPViqneg/default.jpg)
![](https://i.ytimg.com/vi/6O-zEuJwHKU/default.jpg)
![Нейросеть учится переходить дорогу | Обучение с подкреплением](https://i.ytimg.com/vi/pgRAhOBWby0/default.jpg)
![Deep Learning: 1. Слои глубоких сверточных сетей](https://i.ytimg.com/vi/smHmJJ5ee-c/default.jpg)
![Глубокое мультиагентное обучение с подкреплением](https://i.ytimg.com/vi/c2E8gbFqSg8/default.jpg)
![НА ЧТО СПОСОБЕН ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ОТ OPENAI? [KOSMO STORY]](https://i.ytimg.com/vi/0vbk1wG7gqs/default.jpg)
![Делаю нейросеть с нуля](https://i.ytimg.com/vi/GNcGPw_Kb_0/default.jpg)
![Мосты в бильярде - как ставить руку? Обучение с Чемпионом Европы правильной игре в бильярд](https://i.ytimg.com/vi/WdfRqrOszeA/default.jpg)
![Искусственный интеллект учится играть в футбол](https://i.ytimg.com/vi/RScmz65g_0I/default.jpg)
![Classifciation App (Classification learner) in Matlab. Trees, SVMS KNN ADA boost .](https://i.ytimg.com/vi/Db9Bnss8b-8/default.jpg)
![Алгоритмы на Python 3. Лекция №1](https://i.ytimg.com/vi/KdZ4HF1SrFs/default.jpg)
![Foundations of Q-Learning](https://i.ytimg.com/vi/__t2XRxXGxI/default.jpg)
![Что такое Алгоритм случайного леса? Random Forest](https://i.ytimg.com/vi/nbxiRdAk1JY/default.jpg)
![Bellman Equation Basics for Reinforcement Learning](https://i.ytimg.com/vi/14BfO5lMiuk/default.jpg)
![Genetic Algorithm from Scratch in Python (tutorial with code)](https://i.ytimg.com/vi/nhT56blfRpE/default.jpg)
![Машинное обучение методом Q-learning в примерах, Кирилл Саколин](https://i.ytimg.com/vi/R_1Irrp6hJM/default.jpg)
![Как Нейронные Сети Обучают](https://i.ytimg.com/vi/c89HzsRI0Sg/default.jpg)
![Змейка с Q-learning](https://i.ytimg.com/vi/Y_MyEYhYLyU/default.jpg)