Загрузка страницы

[Weekly RL with code]4脚ロボットMinitaurのシミュレータと深層強化学習による歩行学習

強化学習に関する話題をコード付きで毎週更新するシリーズ「Weekly RL with code」の内容です。

Minitaurとよばれる4脚ロボット(4足歩行ロボット)のPyBulletによる学習環境について詳細を説明しています。
また、Stable Baselines3とよばれる強化学習ライブラリを用いて歩行学習を実行しています。

ノートブック:https://gist.github.com/AGIRobots/71fdcb33a268506cc754072f791e217e
解説記事:https://agirobots.com/weekly-rl-with-code-minitaur-1/

00:00 オープニング
0:33 目次
1:45 Minitaur環境の概要
2:55 状態・行動
4:55 報酬
7:10 エピソードの終了条件
8:00 強化学習問題
8:54 コードについて
9:20 PPOによる歩行学習の結果
10:00 SACによる歩行学習の結果
10:57 TQCによる歩行学習の結果
11:27 報酬グラフ
12:20 まとめ

ブログ、Twitter、Instagramでも、情報を発信しています。
チャンネルの登録や、フォローお願いします!
blog:https://agirobots.com/
twitter:https://twitter.com/AGIRobots/
instagram:https://www.instagram.com/agirobots/

Видео [Weekly RL with code]4脚ロボットMinitaurのシミュレータと深層強化学習による歩行学習 канала AGIRobots
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
18 декабря 2022 г. 18:06:03
00:14:48
Другие видео канала
顔のスピーカーと首の動作テスト顔のスピーカーと首の動作テスト制約ボルツマンマシン(RBM) 【Deep Learning アドベントカレンダー2020】制約ボルツマンマシン(RBM) 【Deep Learning アドベントカレンダー2020】誤差逆伝播の理論&導出(式の一般化)【Deep Learning アドベントカレンダー2020】誤差逆伝播の理論&導出(式の一般化)【Deep Learning アドベントカレンダー2020】AGIRobotsのビジョンと2024年の目標AGIRobotsのビジョンと2024年の目標Gazeboとジョイスティックを用いたUnitree A1の仮想モデルの歩行制御を試してみたGazeboとジョイスティックを用いたUnitree A1の仮想モデルの歩行制御を試してみたカルマンフィルタの基礎について詳しく解説!カルマンフィルタの基礎について詳しく解説!初Unity!Fusion360で設計した四足歩行ロボットをUnityで動くようにする-後半初Unity!Fusion360で設計した四足歩行ロボットをUnityで動くようにする-後半誤差逆伝播の理論&導出(行列計算による実現)【Deep Learning アドベントカレンダー2020】誤差逆伝播の理論&導出(行列計算による実現)【Deep Learning アドベントカレンダー2020】小型掃除機のファンの動作確認小型掃除機のファンの動作確認少し歩いてる感じ?になった!少し歩いてる感じ?になった!Fast R-CNNについて詳しく解説!Fast R-CNNについて詳しく解説!ニューラルネットワークで複数種類の入力データを同時に扱う方法について解説!ニューラルネットワークで複数種類の入力データを同時に扱う方法について解説!【ショートバージョン】Dynamic Window Approachによるローカルパスプランニングの基礎と強化学習との融合による移動障害物回避について解説!【ショートバージョン】Dynamic Window Approachによるローカルパスプランニングの基礎と強化学習との融合による移動障害物回避について解説!ヒューマノイドロボット時代の幕開けか Figure 01の衝撃 その仕組みや今後の動向について考察ヒューマノイドロボット時代の幕開けか Figure 01の衝撃 その仕組みや今後の動向について考察世界モデルによる4脚ロボットの歩行学習世界モデルによる4脚ロボットの歩行学習AlexNetの技術についてアイディアレベルで解説 【Deep Learning アドベントカレンダー2020】AlexNetの技術についてアイディアレベルで解説 【Deep Learning アドベントカレンダー2020】DIY 4足歩行ロボット製作DIY 4足歩行ロボット製作【組み込みマシンで大規模言語モデル】JetsonでFlexGenは動くのか?【組み込みマシンで大規模言語モデル】JetsonでFlexGenは動くのか?ホップフィールドネットワーク(Ⅰ) 【Deep Learning アドベントカレンダー2020】ホップフィールドネットワーク(Ⅰ) 【Deep Learning アドベントカレンダー2020】歩けるようになったーー! #Shorts歩けるようになったーー! #Shorts
Яндекс.Метрика