Загрузка...

Q Learning - epsilon greedy + temporal difference Off policy (Wall Following)

This package implements Q Learning Algorithm using epsilon greedy and temporal difference update for a robot in a simulated environment. It includes scripts for training and testing the Q-learning algorithm, as well as launch files for running the simulation in training and testing modes.

Видео Q Learning - epsilon greedy + temporal difference Off policy (Wall Following) канала Shashank Walke
Яндекс.Метрика

На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.

Об использовании CookiesПринять