Структурные модели и глубинное обучение

Совместный семинар ИППИ РАН, НИУ ВШЭ и Сколтеха

25 октября (вторник), аудитория 615 ИППИ РАН

18³⁰

Докладчик: Максим Кретов (5vision)

Тема: Intrinsically-motivated Reinforcement Learning

Аннотация: В докладе будет рассмотрена расширенная постановка задачи обучения с подкреплением, в которую введено понятие "внутренних" (intrinsic) наград или мотиваций для решений агента. Данная постановка особенно актуальна для случаев, когда награда среды за действие агента сильно отложена во времени (reward sparsity). Будут рассмотрены различные подходы к описанию ""внутренней мотивации"" (intrinsic motivation) агента, и разобран подход к обучению и мотивации через "взаимную информацию" (mutual information). "Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning"

19³⁰

Докладчик: Михаил Павлов (5vision)

Тема: Efficient Domain Exploration Methods for Reinforcement Learning

Аннотация: В докладе рассматривается проблема исследования среды через подсчет числа посещенных состояний (модель псевдо-подсчета состояний, pseudo counts) и установлена связь с обучением через "внутреннюю мотивацию" (intrinsic motivation) агента. Результаты продемонстрированы на примере игр Atari. "Unifying Count-Based Exploration and Intrinsic Motivation"

страница семинара

24.10.2016 |

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2025
Об институте | Контакты | Противодействие коррупции