Загрузка страницы

Deep Learning from Logged Interventions - Thorsten Joachims

In this talk, I will explore deep learning methods for batch learning from logged bandit feedback (BLBF). Following the inductive principle of Counterfactual Risk Minimization for BLBF, this talk presents an approach to training deep networks from propensity-scored bandit feedback, demonstrating its effectiveness for applications ranging from visual object detection to ad placement.

Видео Deep Learning from Logged Interventions - Thorsten Joachims канала Criteo Eng
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
30 января 2018 г. 19:21:30
00:45:31
Яндекс.Метрика