ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english

Структурные модели и глубинное обучение

Совместный семинар ИППИ РАН, НИУ ВШЭ и Сколтеха 

25 октября (вторник), аудитория 615 ИППИ РАН   
 
1830
 
Докладчик: Максим Кретов (5vision)
 
Тема: Intrinsically-motivated Reinforcement Learning
 
Аннотация: В докладе будет рассмотрена расширенная постановка задачи обучения с подкреплением, в которую введено понятие "внутренних" (intrinsic) наград или мотиваций для решений агента. Данная постановка особенно актуальна для случаев, когда награда среды за действие агента сильно отложена во времени (reward sparsity). Будут рассмотрены различные подходы к описанию ""внутренней мотивации"" (intrinsic motivation) агента, и разобран подход к обучению и мотивации через "взаимную информацию" (mutual information). "Variational Information Maximisation for Intrinsically Motivated Reinforcement Learning"
 
1930 
 
Докладчик: Михаил Павлов (5vision)
 
Тема: Efficient Domain Exploration Methods for Reinforcement Learning

Аннотация: В докладе рассматривается проблема исследования среды через подсчет числа посещенных состояний (модель псевдо-подсчета состояний, pseudo counts) и установлена связь с обучением через "внутреннюю мотивацию" (intrinsic motivation) агента. Результаты продемонстрированы на примере игр Atari. "Unifying Count-Based Exploration and Intrinsic Motivation"
 
24.10.2016 |
 

 

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2024
Об институте  |  Контакты  |  Противодействие коррупции