Совместный семинар ИППИ РАН, НИУ ВШЭ и Сколтеха
25 октября (вторник), аудитория 615 ИППИ РАН
1830
Докладчик: Максим Кретов (5vision)
Тема: Intrinsically-motivated Reinforcement Learning
Аннотация: В докладе будет рассмотрена расширенная постановка задачи обучения с подкреплением, в которую введено понятие "внутренних" (intrinsic) наград или мотиваций для решений агента. Данная постановка особенно актуальна для случаев, когда награда среды за действие агента сильно отложена во времени (reward sparsity). Будут рассмотрены различные подходы к описанию ""внутренней мотивации"" (intrinsic motivation) агента, и разобран подход к обучению и мотивации через "взаимную информацию" (mutual information). "Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning"
1930
Докладчик: Михаил Павлов (5vision)
Тема: Efficient Domain Exploration Methods for Reinforcement Learning
Аннотация: В докладе рассматривается проблема исследования среды через подсчет числа посещенных состояний (модель псевдо-подсчета состояний, pseudo counts) и установлена связь с обучением через "внутреннюю мотивацию" (intrinsic motivation) агента. Результаты продемонстрированы на примере игр Atari. "Unifying Count-Based Exploration and Intrinsic Motivation"
24.10.2016 | |