Загрузка страницы

Asynchronous Methods for Deep Reinforcement Learning: MuJoCo

The video shows agents trained using the Asynchronous Advantage Actor-Critic (A3C) algorithm performing a variety of motor control tasks. The tasks successfully learned by the agents include pole swing-up, quadruped locomotion, planar biped walking, balancing, 2D target reaching, and 3D manipulation. Paper link - http://arxiv.org/pdf/1602.01783.pdf

Видео Asynchronous Methods for Deep Reinforcement Learning: MuJoCo канала DeepMind
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
15 июня 2016 г. 4:12:25
00:01:23
Яндекс.Метрика