Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научная деятельность >> Семинары >> Технический семинар лаборатории зрительн...

Семинар Лаборатории №11 зрительных систем


Заседания проходят по пятницам, в 1700, в аудитории 615 ИППИ РАН. Семинар открытый, приглашаются все желающие!

 

2017 

26 мая

Тема: Нейросетевые модели мультисенсорного детектора присутствия транспортного средства в зоне классификации пункта взимания платы.

Докладчик: Олег Масленников (студент НИУ ВШЭ).

Аннотация: В системе АКТС (Автоматический Классификатор Транспортных Средств) одну из важнейших ролей играет правильная детекция проездов транспортных средств, потому как от корректности найденных границ ТС зависит правильность дальнейшей работы алгоритмов классификации. В настоящее время в системе задача детекции проездов решается при помощи дополненной экспертными правилами “голосующей схемы”, использующей показания трех первичных детекторов, при которой проезд детектируется, если большая часть детекторов была активна. В докладе будет описан подход к решению задачи детекции проездов в системе АКТС с использованием полносвязных нейронных сетей, а также метод преобразования входных данных, являющихся временными рядами, в формат, необходимый для обучения ИНС.

Ключевые слова: детекция проездов, искусственные нейронные сети, машинное обучение.


19 мая

Тема: Сегментация регистрационных номеров автомобилей с помощью алгоритма динамической трансформации временной оси.

Докладчик: Михаил Поволоцкий (студент ФРТК МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация: При декомпозиции задачи распознавания автомобильных номеров распространено выделение этапа сегментации - поиска положений отдельных символов на вырезанном изображении номера. В докладе будет изложен быстрый алгоритм сегментации, устойчивый к неточностям локализации номера, а также искажениям яркости изображений. Алгоритм использует априорную информацию о геометрии стандартных типов номеров и дополнительно уточняет расположение символов путем оценки и корректировки ошибки локализации. Предлагается модель ошибки локализации номера, оптимальные параметры которой быстро вычисляются на основе динамического программирования. Также будет описана модификация алгоритма для одновременной сегментации и выбора оптимального типа (из априорно известного множества типов номеров). Будут приведены результаты вычислительных экспериментов, демонстрирующих эффективность предложенного подхода.

Ключевые словараспознавание номеров, сегментация номеров, динамическое программирование.

14 апреля 

Тема: Техника линейной кластеризации выборок малой (2-3) размерности с использованием быстрого преобразования Хафа

Докладчик: Егор Ершов (аспирант ФРТК МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация: Одним из известных инструментов, используемых в области обработки изображений, является быстрое преобразование Хафа (БПХ). Ценность данного алгоритма состоит в широком спектре его применимости: выделение прямолинейных границ, детекция точек схода, определение типа шрифта и так далее. В данном докладе будет изложен новый способ эксплуатации БПХ для решения задачи линейной кластеризации в дву- и трехмерных пространствах. Важной особенностью данного алгоритма является глобальная оптимальность результата. Для случая двух гауссовских смесей будет проиллюстрирована работа алгоритма, а также предложены некоторые критерии оптимального разделения.

Ключевые словабыстрое преобразование Хафа, аддитивные статистики, полный перебор, глобальная оптимизация, интегральное изображение.

7 апреля  

Тема: Богатый послеобраз как инструмент исследования механизмов стабильности зрительного поля

Авторы: И.М. Зенкин, А.П. Петров, А.М. Белокопытов (ИППИ РАН).

Аннотация: Использование положительных послеобразов в исследованиях функциональных свойств зрительной системы человека позволяет разрушить идеально согласованные оптические, глазодвигательные и нейронные процедуры, вовлеченные в многоуровневый зрительный процесс. Поскольку информационно-энергетический источник послеобраза «заморожен» на сетчатках глаз, из зрительного потока выпадают несколько важных «технологических» и сигнальных процессов. В этих искусственных для зрительной системы условиях проявляется деятельность важных глубинных уровней системы. Описание наблюдаемых феноменов и их возможная интерпретация составляют содержание настоящего доклада.

Ключевые словабогатый и бедный послеобраз, зрительное поле, движения глаз, иллюзии.

10 марта 

Тема: Подводная иллюзия как инструмент исследования механизмов бинокулярного стереосинтеза.

АвторыИ.М. Зенкин, А.П. Петров, С.Ю. Трифонов

АннотацияЛюбителям подводного плавания с маской хорошо известна иллюзия изменения размеров и расстояний в подводном зрительном поле. Это и есть хорошо известная в науке «подводная иллюзия». Анализ ее происхождения показал нам, что наличие плоскости раздела двух сред с разными коэффициентами преломления приводит к нарушению правил геометрической оптики для построения образа объекта в оптической системе. Это вынуждает зрительную систему, именно ее бинокулярный фузионный механизм, предпринимать «специальные усилия» для преодоления диплопии и синтеза адекватного зрительного поля. В докладе описываются детали этого процесса и сравниваются результаты модельных расчетов и экспериментальных данных.

Ключевые словазрительные иллюзии, механизмы стереосинтеза, стабильность зрительного поля, направление взора.

17 февраля

Распознавание отдельно стоящих строений на аэрофотоснимках

Докладчик: Ирина Кунина (аспирантка I года ФИВТ МФТИ, м.н.с. лаборатории №11 ИППИ РАН).

Аннотация: Рассматривается решение задачи распознавания единичных строений вне населенных пунктов на аэрофотоснимках в инфракрасном диапазоне. Под единичным строением понимается объект прямоугольной формы, расположенный отдельно от группы подобных объектов. Столь специфическая постановка актуальна, в частности, для поиска незаконных построек. В докладе будет описано решение данной задачи, состоящее из следующих этапов:
1. Поиск характерных особенностей (особых точек) на изображении c использованием детектора Харриса;
2. Проверка гипотезы о принадлежности конкретной особой точки углу строения на основе сверточных нейронных сетей (CNN);
3. Проверка гипотезы о принадлежности участка изображения, ограниченного заданной геометрической фигурой, строению, на основе CNN;
4. Геометрическая фильтрация результатов.

Ключевые словадешифровка изображений, аэрокосмические снимки, особые точки, сверточные нейронные сети.

20 января

Тема: Решение задачи управления скоростью движения автомобиля с электродвигателем.

Докладчик: Семёнов Илья (6 курс ФИВТ МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация:

В рамках семинара будут рассмотрены:
1. Основы теории управления и методы синтеза простых регуляторов;
2. Модель продольного движения автомобиля с электродвигателем UOT Electric March II;
3. Обзор различных типов регуляторов для управления скоростью;
4. Применение описанных методов к управлению скоростью движения робота-макета.

Ключевые словатеория управления, беспилотный электромобиль. 

2016

 

30 сентября  

Михаил Бабин (к.ф.-м.н., бывший сотрудник Google)

Теоретические обоснования глубинного обучения

Семинар посвящён "теоретическому" обоснованию глубинного обучения искусственных нейронных сетей (НС).
Планируется кратко рассмотреть следующие темы (от простых к более сложным):
1.      Универсальность НС как аппроксиматоров.
2.      PAC learning и Радемахеровская сложность НС.
3.      PAC-обучаемость НС множеству многочленов ограниченной степени.
4.      PAC-обучаемость случайных (упрощенных и не очень стандартных) НС-генеративных моделей.
5.      Обратимость генеративных моделей (тут уже обычные Relu + dropout feed forward НС).
6.      Близость локальных минимумов функции потерь НС к глобальному (при условии некоторых гипотез).

Ключевые слова: искусственные нейронные сети, глубинное обучение. 

24 июня

Лев Тепляков (студент 3-го курса ФРТК МФТИ)

Обзор методов извлечения локальных особенностей

Аннотация: Локальные особенности - это характерные участки изображения, отличающиеся от окрестности - углы, пятна, грани, однородные области. На семинаре для задачи извлечения особенностей будут рассмотрены требования к идеальному алгоритму, обсуждены существующие подходы к решению задачи и наиболее известные алгоритмы. Эти алгоритмы будут проанализированы на инвариантность относительно изменения масштаба, аффинных и проективных преобразований, что является одним из важнейших свойств локальных особенностей. Ввиду большой вычислительной сложности некоторых операций будут рассмотрены приближенные методы, позволяющие ускорить алгоритмы.

Ключевые слова: особая точка, инвариантные особенности, SURF, Harris, Hessian, DoG, MSER.

10 июня   

Алексей Савчик (аспирант ИППИ РАН)

Пересечение T и H поляр

В цикле статей про проективное распознавание овалов Николаевым П.П. были сформулированы некоторые гипотезы относительно овалов и возникающих при их рассмотрении объектов, например поляр в случае овала с выделенной точкой. Одну из гипотез, про количество точек пересечения поляр, удалось доказать. На семинаре будет сформулировано и доказано утверждение, что в общем случае точек пересечения T и H поляр хотя бы 3. Также будут сформулированы некоторые другие открытые гипотезы из статей Николаева П.П. Содержание доклада скорее математическое, но формул в нём не будет, больше иллюстрации и утверждения вроде "прямая в общем случае пересекает замкнутую кривую на плоскости в чётном числе точек". Доказательство основано на замечании, что точки пересечения касательных к графику с ним же топологически разбиваются на петли.

Ключевые слова: проективная плоскость, проективно инвариантные построения, T и H поляры овала, топологические соображения.

15 апреля

Елена Максимова (с.н.с. ИППИ РАН, лаб. 8)

Сетчатка как первичный центр обработки зрительной информации

Описание изображения внешнего мира, проектируемое оптикой глаза на растр рецепторов, передается в мозг по аксонам ганглиозных клеток (ГК) в виде разнообразных импульсных посылок. Описано к настоящему времени более двух десятков морфо-функциональных типов ГК, интерпретирующих, каждый по-своему, это изображение. Поле зрения, или рецептивное поле (РП) каждой ГК составляет около 3-10 угловых градусов.  Тип импульсной реакции ГК определяется спецификой ее синаптических связей (wiring) с рецепторами через биполяры (в наружном синаптическом слое) и биполяры и амакриновые клетки (во внутреннем синаптическом слое). Все поле зрения (вся рецепторная матрица) покрывается, как кафелем, РП всех типов ГК. Одни ГК реагируют на потемнение в их рецептивном поле (OFF-тип), другие - на посветление (ON- тип). Их импульсные посылки могут быть кратковременными (в момент включения или выключения стимула) или длящимися в течение всего действия стимула. Есть ГК вовсе не реагирующие на включение-выключение света. Они, однако, бурно реагируют на движение в их РП контрастных объектов. Это так называемые детекторы движения.  Есть несколько типов детекторов направления движения, детекторов ориентированных линий, детекторов мелких контрастных подвижных пятен. Аксоны разных типов ГК приходят в разные первичные зрительные отделы мозга (зрительные покрышки, коленчатое тело и т.д.), где они образуют ретинотопические проекции. Аксональные окончания разных типов ганглиозных клеток оканчиваются в разных слоях этих ядер, где и переключаются на собственно нейроны мозга. Там происходит дальнейшая обработка зрительного сигнала или переключение на нейроны, организующие соответственные поведенческие зрительно-обусловленные реакции. Так, например, известно, что детекторы пятна запускают пищевое поведение (у лягушек и рыб), а детекторы затемнения - оборонительное. Как устроены (напаяны) разные типы ГК и для чего они используются в поведении  -  вот два основных вопроса зрительной физиологии.

Ключевые слова: сетчатка, ганглиозные клетки, рецептивное поле, импульсы (спайки), синапсы, детекторы движения, первичные зрительные центры, зрительно-обусловленное поведение.

1 апреля

Алексей Алипер (и.о. м.н.с. ИППИ РАН, лаб. 8)

Строение и принципы организации сетчатки у позвоночных животных

Сетчатку справедливо называют частью мозга, выдвинутой на периферию. Двумерное инвертированное уменьшенное изображение внешнего мира на растре рецепторов каким-то образом трансформируется в представление о подвижном трехмерном мире. Как это происходит?  Ответ на этот вопрос пытаются найти морфологи и физиологи, полагая, что знание строения отдельных клеток, их связей и сигналов, при помощи которых они взаимодействуют, может помочь. Общий план строения сетчаток разных позвоночных животных был продемонстрирован более 100 лет назад. Сетчатка позвоночных состоит из трех ядерных и двух сетчатых слоев, образованных фоторецепторами, горизонтальными клетками, биполярными клетками, амакриновыми клетками и ганглиозными клетками. С тех пор это представление не поменялось, а современные методы лишь расширили наши знания об устройстве сетчатки. Во внешней сетчатке сигнал от рецепторов к биполярным клеткам, от биполярных клеток к ганглиозным передается неимпульсным путем. Там имеют место лишь медленные потенциалы, градуально зависящие от силы света. Ганглиозные клетки уже передают свой сигнал импульсами. Таким образом, во внутреннем синаптическом слое происходит перекодировка информации о свете. Ганглиозных клеток на данный момент известно множество типов, каждый из них имеет особенности структуры дендритного древа и обслуживается на входе своим набором биполярных и амакриновых клеток, что влияет на свойства выходного сигнала. Современные исследования сетчатки направлены на разрешение вопросов, как именно формируются ответы различных ганглиозных клеток, и какую задачу они могут решать в организации зрения.

Ключевые слова: сетчатка, зрение, ганглиозные клетки.

18 марта

Галина Рожкова

Морфологическая и функциональная неоднородность сетчатки человека: загадки крайней периферии

Хорошо известно, что сетчатка человека очень неоднородна: состав и плотность рецепторов и других клеточных элементов сильно меняются с изменением расстояния от заднего полюса глаза и различны для разных меридианов. Подавляющее число работ посвящено исследованию структуры и функции центральной области и «умеренной» периферии сетчатки. В то же время имеются интригующие и как бы противоречивые данные об особенностях самой крайней периферии. С одной стороны, давно обнаружено, что на границе сетчатки – вдоль её зубчатого края (ora serrata) – имеется кольцевая зона повышенной плотности колбочковых фоторецепторов, указывающая на возможную специфическую зрительную функцию крайней периферии, а с другой стороны, есть мнение, что примыкающая к ora serrata часть сетчатки является фактически слепой, и человек не воспринимает действующие на неё световые стимулы. Литература, посвященная крайней периферии сетчатки, немногочисленна и разнородна. В докладе будут представлены морфологические данные по крайней периферии сетчатки и рассмотрены различные гипотезы о возможном функциональном назначении колбочкового кольца и слепой зоны – обнаружение опасности, оценка оптического потока во время движения, вклад в константность цветовосприятия и др.

Ключевые слова: ora serrata, периферическая сетчатка, плотность рецепторов, обнаружение опасности, контроль локомоции, цветовая константность. 

11 марта

Даниил Кононенко (аспирант Сколтеха)

Система коррекции взгляда при видеоконференции, обучаемая по данным со слабой разметкой

Задача коррекции взгляда при видеоконференции поставлена как задача обучения с учителем. Предложен алгоритм решения, работающий в реальном времени и не требующий дополнительного оборудования кроме стандартной веб-камеры. Алгоритм основан на методе случайных лесов специального вида, обучающихся по данным со слабой разметкой. Предложен метод сбора и предобработки коллекции пар изображений, описывающих перевод взгляда и использующихся для обучения предложенного алгоритма. Обучение происходит на парах изображений лиц людей с фиксированной угловой разницей в направлении взгляда. В тест-тайме для человека не из обучающей выборки взгляд изменяется на тот же угол, что и в обучающей выборке.

Ключевые слова: монокулярная коррекция взгляда, машинное обучение, случайный лес, слабая разметка, глубокое обучение.

4 марта

Иван Коноваленко (аспирант ФРТК МФТИ, мнс лаб. 11 ИППИ РАН)

Основы стереозрения

Заседание проводится в связи с востребованностью заявленной темы при решении множества задач компьютерного зрения и не требует специальных предварительных знаний. В начале семинара в качестве необходимого введения будут разобраны вопросы, связанные с монозрением, такие как внутренние параметры камеры и проективная геометрия. На основной части семинара будут разобраны вопросы, относящиеся к стереозрению. Планируется обсуждение теории, популярных инструментов калибровки и типичных ошибок.

Ключевые слова: модель камеры, проективная геометрия, однородные координаты, эпиполярная геометрия, калибровка стереопары.

19 февраля 

Егор Ершов (аспирант МФТИ, м.н.с. лаб 11 ИППИ РАН)

Применение быстрого преобразования Хафа для разделения маломерных распределений. Трехмерное преобразование Хафа

Одним из классических инструментов в области обработки изображений является преобразование Хафа, но, к сожалению, наряду с известностью самого преобразования распространяется общепринятое клише, что данный инструмент обладает высокой вычислительной стоимостью, что, в свою очередь, служит плохую службу менее известному быстрому преобразованию Хафа.
На семинаре будет предпринята очередная попытка популяризации БПХ, представлен новый алгоритм трехмерного БПХ. На основе вышеизложенных алгоритмов построена схема пространственного разделения маломерных (2D или 3D) распределений, которая так же будет изложена на семинаре.

Ключевые слова: быстрое преобразование Хафа (БПХ), трехмерное преобразование Хафа, пространственное разделение.

Прошедшие заседания - 2015

НОВОСТИ И ОБЪЯВЛЕНИЯ
Открытый семинар Лаборатории зрительных систем №11: 26.05.2017 (пятница), 17:00, ауд. 615 ИППИ РАН. ...
Общемосковский междисциплинарный семинар <<Глобус>> 25 мая в 15.40 в НМУ, конференц-зал. Георгий Шаб...
Семинар лаборатории № 8: 25 мая в 14:30 в ИПЭЭ РАН. Н.Г. Бибиков. Раки щелкуны Черного и Японского м...
Семинар по теории кодирования: 23.05.2017 (вторник),19:00, ауд.307 ИППИ. Максим Жуковский (МФТИ) "Л...
Семинар Добрушинской математической лаборатории: 23.05.2017 (вторник), 16:00, ауд. 307 ИППИ РАН. Ser...
Семинар Лаборатории нейробиологии моторного контроля №9: 25.05.2017 (четверг), 14:00, ауд. 309. Дмит...
Открытый семинар Лаборатории зрительных систем №11: 19.05.2017 (пятница), 17:00, ауд. 615 ИППИ РАН. ...
Семинар по теоретической семантике: 19.05.2017 (пятница), 16:00, зал заседаний ученого совета ИППИ В...
Семинар по теории кодирования: 16.05.2017 (вторник),19:00, ауд.307 ИППИ. О. Толмачева "Обзор границ ...
Семинар лаборатории № 8: 18 мая в 14:30 в ИПЭЭ РАН. В.Ю. Веденина. Два механизма звукоизлучения у са...
Все новости   
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2017
Об институте  |  Контакты  |  Старая версия сайта