[Weekly RL with code]4脚ロボットMinitaurのシミュレータと深層強化学習による歩行学習
強化学習に関する話題をコード付きで毎週更新するシリーズ「Weekly RL with code」の内容です。
Minitaurとよばれる4脚ロボット(4足歩行ロボット)のPyBulletによる学習環境について詳細を説明しています。
また、Stable Baselines3とよばれる強化学習ライブラリを用いて歩行学習を実行しています。
ノートブック:https://gist.github.com/AGIRobots/71fdcb33a268506cc754072f791e217e
解説記事:https://agirobots.com/weekly-rl-with-code-minitaur-1/
00:00 オープニング
0:33 目次
1:45 Minitaur環境の概要
2:55 状態・行動
4:55 報酬
7:10 エピソードの終了条件
8:00 強化学習問題
8:54 コードについて
9:20 PPOによる歩行学習の結果
10:00 SACによる歩行学習の結果
10:57 TQCによる歩行学習の結果
11:27 報酬グラフ
12:20 まとめ
ブログ、Twitter、Instagramでも、情報を発信しています。
チャンネルの登録や、フォローお願いします!
blog:https://agirobots.com/
twitter:https://twitter.com/AGIRobots/
instagram:https://www.instagram.com/agirobots/
Видео [Weekly RL with code]4脚ロボットMinitaurのシミュレータと深層強化学習による歩行学習 канала AGIRobots
Minitaurとよばれる4脚ロボット(4足歩行ロボット)のPyBulletによる学習環境について詳細を説明しています。
また、Stable Baselines3とよばれる強化学習ライブラリを用いて歩行学習を実行しています。
ノートブック:https://gist.github.com/AGIRobots/71fdcb33a268506cc754072f791e217e
解説記事:https://agirobots.com/weekly-rl-with-code-minitaur-1/
00:00 オープニング
0:33 目次
1:45 Minitaur環境の概要
2:55 状態・行動
4:55 報酬
7:10 エピソードの終了条件
8:00 強化学習問題
8:54 コードについて
9:20 PPOによる歩行学習の結果
10:00 SACによる歩行学習の結果
10:57 TQCによる歩行学習の結果
11:27 報酬グラフ
12:20 まとめ
ブログ、Twitter、Instagramでも、情報を発信しています。
チャンネルの登録や、フォローお願いします!
blog:https://agirobots.com/
twitter:https://twitter.com/AGIRobots/
instagram:https://www.instagram.com/agirobots/
Видео [Weekly RL with code]4脚ロボットMinitaurのシミュレータと深層強化学習による歩行学習 канала AGIRobots
Показать
Комментарии отсутствуют
Информация о видео
Другие видео канала
![顔のスピーカーと首の動作テスト](https://i.ytimg.com/vi/i65o-A_C09I/default.jpg)
![制約ボルツマンマシン(RBM) 【Deep Learning アドベントカレンダー2020】](https://i.ytimg.com/vi/LTd4t-qcsuI/default.jpg)
![誤差逆伝播の理論&導出(式の一般化)【Deep Learning アドベントカレンダー2020】](https://i.ytimg.com/vi/j7eGdIJGOGo/default.jpg)
![AGIRobotsのビジョンと2024年の目標](https://i.ytimg.com/vi/77Uly6Bp-bw/default.jpg)
![Gazeboとジョイスティックを用いたUnitree A1の仮想モデルの歩行制御を試してみた](https://i.ytimg.com/vi/1xi4rUHYB40/default.jpg)
![カルマンフィルタの基礎について詳しく解説!](https://i.ytimg.com/vi/GH4AficLbLM/default.jpg)
![初Unity!Fusion360で設計した四足歩行ロボットをUnityで動くようにする-後半](https://i.ytimg.com/vi/xg8Iup1a8fI/default.jpg)
![誤差逆伝播の理論&導出(行列計算による実現)【Deep Learning アドベントカレンダー2020】](https://i.ytimg.com/vi/JY2oL0S3b9s/default.jpg)
![小型掃除機のファンの動作確認](https://i.ytimg.com/vi/q2n4nDmPVNU/default.jpg)
![少し歩いてる感じ?になった!](https://i.ytimg.com/vi/RwzMTUmuC-4/default.jpg)
![Fast R-CNNについて詳しく解説!](https://i.ytimg.com/vi/sTJ-CN3CwZU/default.jpg)
![ニューラルネットワークで複数種類の入力データを同時に扱う方法について解説!](https://i.ytimg.com/vi/jzUP5-7th08/default.jpg)
![【ショートバージョン】Dynamic Window Approachによるローカルパスプランニングの基礎と強化学習との融合による移動障害物回避について解説!](https://i.ytimg.com/vi/P1kTVRjKtWc/default.jpg)
![ヒューマノイドロボット時代の幕開けか Figure 01の衝撃 その仕組みや今後の動向について考察](https://i.ytimg.com/vi/tfL-zrn7cCc/default.jpg)
![世界モデルによる4脚ロボットの歩行学習](https://i.ytimg.com/vi/cCtXhipeBNc/default.jpg)
![AlexNetの技術についてアイディアレベルで解説 【Deep Learning アドベントカレンダー2020】](https://i.ytimg.com/vi/IMjlerQLWiU/default.jpg)
![DIY 4足歩行ロボット製作](https://i.ytimg.com/vi/Zn7aaKdHey0/default.jpg)
![【組み込みマシンで大規模言語モデル】JetsonでFlexGenは動くのか?](https://i.ytimg.com/vi/ewICFFsz8eA/default.jpg)
![ホップフィールドネットワーク(Ⅰ) 【Deep Learning アドベントカレンダー2020】](https://i.ytimg.com/vi/hNgmgqwdyDs/default.jpg)
![歩けるようになったーー! #Shorts](https://i.ytimg.com/vi/u1k4xEYUA5c/default.jpg)