Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научная деятельность >> Семинары >> Открытый семинар лаборатории № 11 «Зрите...

Семинар Лаборатории №11 зрительных систем


Заседания проходят по пятницам, в 1700, в аудитории 615 ИППИ РАН. Семинар открытый, приглашаются все желающие!

 

2019

18 октября

Тема: Зрительное поле человека как рендеринг внутренней модели зрительного пространства

Докладчик: Гарри Михайлович Зенкин, ИППИ РАН.

Аннотация: Серией наших опытов было показано, что при исследовании зрительных послеобразов (ПО) полезно различать по крайней мере два типа таких объектов, для которых было предложено наименование "бедный" и "богатый" послеобраз. В то время как поведение бедного ПО можно описать в какой-то степени законом Эммерта, при наличии в поле зрения богатого ПО закон Эммерта нарушается и фиксируется целая серия парадоксальных феноменов, которые были поименованы как "иллюзии богатого послеобраза". Эти иллюзии выражаются прежде всего в нарушении стабильности зрительного поля и константности направления взора. Существенно также то, что эти иллюзии сохраняются намного дольше времени существования вызвавшего их богатого ПО уже при полном отсутствии на сетчатках зрительной стимуляции. Геометрический анализ этих иллюзий позволяет высказать обоснованное представление о работе механизмов константности зрительного поля и зрительного направления, а также и о зрительной ориентации наблюдателя в пространстве. Ничего подобного не происходит в присутствии в поле зрения бедного ПО. Однако при наклоне головы к плечу ПО обоих типов ведут себя одинаковым образом — и бедный и богатый ПО разворачиваются в сторону наклона головы на угол, близкий к углу наклона головы. Эта особенность поведения богатого ПО была более детально исследована в дальнейших опытах и привела к формулировке гипотезы, содержание которой частично отражено в названии данного доклада. В докладе будет приведена детальная формулировка гипотезы и наглядно представлены результаты опытов с богатым ПО, позволяющие интерпретировать её смысловое содержание.

Ключевые слова: зрительные послеобразы, стабильность зрительного поля, константность зрительного направления, иллюзия богатого послеобраза, виртуальное пространство, маркеры реального пространства, наклон головы к плечу.

 

 

 

19 июля

Тема: Мезоскопическая нейросетевая модель дистанционной активации очага эпилепсии

Докладчик: Александр Ваноевич Параскевов, научный сотрудник НИЦ «Курчатовский институт».

Аннотация: В планарных биологических нейронных сетях in vitro к определенному возрасту начинают спонтанно происходить события кратковременной глобальной синхронизации спайковой активности нейронов - популяционные спайки. Они возникают из небольшого числа стационарных центров нуклеации, напоминающих очаги возникновения эпилептических приступов. Если предположить, что есть функциональная аналогия между центрами нуклеации и очагами эпилепсии, не связанными с явными повреждениями мозга, то возникает вопрос – активируется ли такой очаг изнутри, т.е. автономно по отношению к окружающей нервной ткани, или извне? Сценарий «внутренней» активации предполагает, что очаг содержит пейсмекеры, т.е. нейроны, которые квази-периодически генерируют спайки без какой-либо внешней стимуляции. С другой стороны, есть экспериментальные данные, которые указывают на пространственно-нелокальную, «внешнюю» активацию очага эпилепсии.

Для прояснения ситуации мы построили математическую модель двумерной нейронной сети, состоящей из спайковых т.н. LIF (Leaky Integrate-and-Fire) нейронов, соединенных друг с другом синапсами, обладающими релаксационной пластичностью. Коннектом нейронной сети, т.е. совокупность межнейронных связей, формировался вероятностным образом, предполагая, что вероятность образования синаптического контакта экспоненциально убывает с расстоянием между нейронами. Спайковая активность сети поддерживалась за счет наличия у каждого нейрона постоянного «фонового» тока, величина которого определялась случайным образом из положительной части нормального распределения с ненулевым средним значением. Индивидуальные значения фоновых токов определяли естественный разброс возбудимости нейронов и долю нейронов-пейсмекеров от полного числа нейронов сети. Наконец, для решения поставленного вопроса, все нейроны-пейсмекеры были пространственно сгруппированы в круглом центральном пятне так, чтобы их пространственная плотность в пятне была такой же, как и средняя плотность нейронов сети. Такое искусственное расположение пейсмекеров не затронуло глобальный динамический режим спонтанных и нерегулярных популяционных спайков и критически помогло в визуализации процесса активации их центров нуклеации, что было практически невозможно сделать при естественном, пространственно-однородном распределении пейсмекеров.

Компьютерное моделирование показало, что стационарные центры нуклеации популяционных спайков (1) могут возникать в местах, расположенных далеко от пятна с пейсмекерами и (2) могут активироваться, не имея прямых связей от пейсмекеров. Не смотря на сравнительную простоту модели, эти результаты наглядно демонстрируют принципиальную возможность «внешней», дистанционной активации очага эпилепсии в мозге и качественно подтверждают интерпретацию вышеупомянутых экспериментальных данных.

Ключевые слова: двумерная нейронная сеть, спайковый нейрон, релаксационная синаптическая пластичность, популяционный спайк, математическая модель, фокальная эпилепсия.

 

7 июня

Совместный семинар лаб. № 2 и лаб. № 11 ИППИ РАН

Тема: Представление диссертационной работы Михаила Сергеевича Усанова «ИССЛЕДОВАНИЕ СВОЙСТВ ШУМОВ МЕДИЦИНСКИХ ДИАГНОСТИЧЕСКИХ ИЗОБРАЖЕНИЙ», подготовленной на соискание ученой степени кандидата физико-математических наук по специальности 05.13.18 – «Математическое моделирование, численные методы и комплексы программ».

 

17 мая

Совместный семинар лаб. №15 и лаб. №11 ИППИ РАН

Тема: Алгоритмы лингвистического процессора ЭТАП-4

Докладчик: Виктор Геннадьевич Сизов (сектор 15.1 ИППИ).

Анонс: Доклад посвящен описанию двух наиболее интересных алгоритмов, используемых для обработки текстов лингвистическим процессором ЭТАП-4. Движок правил FORET преобразует структуры предложения с помощью правил, написанных лингвистами на языке FORET.  Этот алгоритм или его модификации используются ЭТАП-4 при решении практически всех задач (машинный перевод, перефразирование, семантический анализ). Алгоритм синтаксического анализа выделяет наиболее вероятное синтаксическое дерево из графа гипотетических синтаксических связей. Для выделения дерева используются различные фильтры. Значительная роль отводится временной оптимизации.

Ключевые слова: ЭТАП-4, FORET, логика предикатов 1 порядка, синтаксический анализ, дерево зависимостей. 

 


12 апреля

Тема: Digital Image Steganography: современные методы и задачи

Докладчик: Клим Сергеевич Киреев (5 курс Skoltech CDISE и ФРТК МФТИ).

Научный руководитель: Григорий Анатольевич Кабатянский (д.ф.-м.н., советник ректора по науке Skoltech, профессор ФКН НИУ ВШЭ).

Аннотация: Стеганография (также известна как data hiding), это техника, позволяющая скрывать информацию внутри цифровых носителей. В данном докладе предлагается рассмотреть главные методы и направления в стеганографии для основных форматов изображений (jpeg, png), а также проблемы и задачи, стоящие перед этой наукой.

Ключевые слова:steganography, data hiding, JPEG.

 

 

15 марта

Тема: Структурная визуализация мультиспектральных изображений: текущее состояние, успехи и проблемы

Докладчик: Сидорчук Дмитрий Сергеевич (м.н.с. лаб. №11 ИППИ, аспирант ФИВТ МФТИ).

Аннотация: На семинаре будет рассмотрена задача визуализации многоканальных изображений с учетом особенностей зрительного восприятия человека. Данная задача актуальна при работе с результатами мультиспектрального, радиолокационного, тепловизионного и других исследований объектов, например, при дистанционном зондировании Земли.

Особое внимание будет уделено подходу структурной визуализации многоканальных изображений, основным принципом которого является сохранение локальных контрастов исходного изображения. В рамках этого подхода многоканальный контраст в каждом пикселе определяется вектором, называемым псевдоградиентом. Будет рассмотрена проблема выбора направлений (знаков) векторов псевдоградиентного векторного поля. Неправильный выбор этих знаков может приводить к существенным искажениям на результирующем изображении. Будет проведен обзор существующих алгоритмов решения этой проблемы, а также описан новый, разработанный нами, алгоритм на основе имитации отжига.

Эффективность нового алгоритма выбора знаков в рамках подхода структурной визуализации мультиспектральных изображений будет продемонстрирована в применении к родственной задаче деколоризации цветных изображений на общедоступных датасетах (Cadic, COLOR250) с использованием показателей качества CCPR и E-score.

Ключевые слова: мультиспектральная визуализация, локальный контраст, структурный тензор Ди Зензо, деколоризация, проблема знаков.

 

8 февраля 

Совместный семинар лаб. №15 и лаб. №11 ИППИ РАН

Тема: Формальный язык для записи лингвистической информации в системе ЭТАП

Докладчик: Леонид Львович Цинман (лаборатория компьютерной лингвистики, сектор математического обеспечения лингвистических систем).

Аннотация: Нам логика строить язык помогает (язык FORET - опыт "практической логики").

Ключевые слова: формальные языки, логика первого порядка, логика предикатов, практическая логика. 

 

25 января

Совместный семинар лаб. №15 и лаб. №11 ИППИ РАН

Тема: Глубокий семантический анализ текстов в лингвистическом процессоре ЭТАП-4

Докладчик: Иван Рыгаев, лаборатория №15 ИППИ.

Аннотация: В лаборатории № 15 мы разрабатываем лингвистический процессор ЭТАП, который имеет такие функции как машинный перевод, морфосинтаксический анализ текстов, перефразирование, конвертация в Universal Networking Language (UNL) и другие. В последние несколько лет мы сосредоточились на задаче глубокого семантического анализа текстов, которая предполагает представление смысла предложения на формальном языке, а также дополнение этого представления всеми возможными выводами, которые человек мог бы сделать из этого предложения при помощи т. н. commonsense reasoning (умозаключений на основе здравого смысла). То есть мы пытаемся добиться от компьютера понимания текста, сравнимого с человеческим. В докладе мы расскажем о том, как устроен ЭТАП, об основных шагах семантического анализа и подробно остановимся на умозаключениях - как они работают, что уже позволяют получать, и какие нерешённые проблемы ещё предстоит решить.

Ключевые слова: лингвистика, семантические анализ, понимание, умозаключения, логический вывод.

Видеозапись семинара

2018

22 ноября (14:00)

Совместный семинар лаб. №2, лаб. №11 и лаб. №15 ИППИ РАН

Тема: Представление диссертационной работы Малых Валентина Андреевича «Модели, методы и алгоритмы, устойчивые к шуму, в задачах обработки естественного языка», подготовленной на соискание ученой степени кандидата технических наук по специальности 05.13.11 – «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей».

 

8 ноября

Совместный семинар лаб. №2, лаб. №11 и Центра распределённых вычислений ИППИ РАН

Тема: Представление диссертационной работы Кокорева Дениса Сергеевича «МОДЕЛИРОВАНИЕ ПРОЦЕССА ВПИСЫВАНИЯ МНОГОГРАННЫХ 3D-ОБЪЕКТОВ», подготовленной на соискание ученой степени кандидата технических наук по специальности 05.13.18 – «Математическое моделирование, численные методы и комплексы программ».   

 

21 сентября

Title: Robot navigation in dynamic environments

Speaker: Gonzalo Ferrer

Short bio: Gonzalo Ferrer completed his PhD thesis in 2015 on robot navigation algorithms in urban environments at the Institut de Robotica i Informatica Industrial IRI, a group inside the Universitat Politecnica de Catalunya (UPC), in Barcelona, Spain.

Before joining Skoltech, Gonzalo worked during two years as a Research Fellow (postdoc) at the APRIL lab. and Intermittent Lecturer in the department of Computer Science and Engineering at the University of Michigan.

Gonzalo has collaborated on international research projects and industry research initiatives, such as the URUS project on human robot cooperation in urban areas or the NGV project in alliance with the Ford Motor Co. on autonomous driving.

In January 2018, Gonzalo joined the Skolkovo Institute of Science and Technology as an Assistant Professor. He will be heading the Mobile Robotics lab., focusing his research on planning, perception and how to combine both into new solutions in robotics.

Abstract: The task of navigating, that is, moving from one place to another in any kind of environment, is an extremely easy task for humans. Robots on the other hand, barely perceive the world, which is formidably complex and process this limited data to plan their motions. One can argue that on simple scenarios, the task of navigating is completely solved. Nonetheless, full autonomy in robotics has not arrived yet. This is a key aspect for the future deployment of robots in order to be a mainstream technology adopted by society, either if robots are mobile platforms, autonomous cars, flying quadcopter, etc.

In this talk, I will present an overview of my work on robot navigation on dynamic environments. Under the interaction with pedestrians, complex situations arise where known path planning techniques provide poor solutions. I will present a new prediction approach on human motion and how to integrate it under the same planning scheme, obtaining a more intelligent robot motion behavior.

Still, some degree of uncertainty is unavoidable, due to the unpredictable nature of pedestrians, making impossible a perfect accuracy on prediction. Hence, I will discuss on how to calculate plans on adversarial scenarios, leveraged by probability distributions, as an effective way to avoid potentially dangerous situations.

 

20 сентября

Совместный семинар лаб. №2 и лаб. №11 ИППИ РАН

Тема: Представление диссертационной работы Ершова Егора Ивановича «Вычислительные методы анализа изображений на основе быстрого преобразования Хафа в пространствах низкой размерности», подготовленной на соискание ученой степени кандидата физико-математических наук по специальности 05.13.17 – «Теоретические основы информатики».

Докладчик: Ершов Егор Иванович, м.н.с. лаборатории 11 “Зрительные системы”

Научный руководитель: к.ф.-м.н. Николаев Дмитрий Петрович

Аннотация: В первой части доклада пойдет речь об алгоритме быстрого преобразования Хафа (БПХ), впервые предложенного П. Брейди в 1992 году, и способах его обобщения на трехмерные случаи: для приближения преобразования Радона и Йона соответственно. Полученный алгоритм для расчета БПХ по прямым в трехмерном изображении имеет сложность Θ(n^4), то есть Θ(1) на каждое выходное значение. Другой ключевой характеристикой алгоритмов семейства БПХ является точность аппроксимации прямых. В докладе будет рассказано о специфике диадического дискретного паттерна как аппроксимации прямой или гиперплоскости. Согласно работе П. Брейди ортотропная (для вертикальных прямых – построчная) ошибка аппроксимации диадического плоского паттерна ограничена величиной (1/2)log2(n). Позднее в работе Е. Ершова и С. Карпенко эта оценка была улучшена до (1/6)log2(n). С опорой на эти результаты в докладе будут представлены оценки ортогональной ошибки аппроксимации в худшем случае для двумерного и трехмерных случаев.

Во второй части доклада по мотивам работ Н. Кирьятти и А. Брукштейна будет изложен метод вычисления М-оценки на двумерных и трехмерных изображениях в задаче робастной ортогональной линейной регрессии с использованием БПХ и рассмотрены оценки его точности.

И, наконец, в заключительной третьей части будет изложен оригинальный метод использования БПХ для решения задач линейной бинарной кластеризации гистограмм, параметризуемый критерием разделения и способ оценки точности полученного результата.

 

 

 

 

 

20 июля

Тема: Системы понимания изображений, основанные на методе геометризованных гистограмм

Докладчик: Кий Константин Иванович, (к. ф.-м. н., с.н.с. отдела 5 Федерального государственного бюджетного учреждения науки Институт прикладной математики им. Келдыша Российской Академии Наук (ИПМ РАН), Москва, konst.i.kiy@gmail.com).

Аннотация: На основе метода геометризованных гистограмм предлагается схема построения систем понимания изображений и видеопоследовательностей изображений. На базе данной схемы реализуется построение систем понимания изображений и видеопоследовательностей изображений дорожных сцен. В частности, приводится схема построения систем нахождения границы растительной обочины, дороги, границ области неба в кадре и системы поиска автомобилей на дороге. Описывается реализация указанных систем в виде программного комплекса. Приводятся и обсуждаются результаты программных экспериментов.

Ключевые слова: сегментация изображений, системы понимания изображений, анализ дорожных сцен, навигация беспилотных автомобилей.

 

30 марта

Тема: Цветовое зрение: От сетчатки к корковым центрам

Докладчик: Галина Владимировна Парамей.

Получила высшее образование на факультете психологии МГУ, там же училась в аспирантуре и в 1983 г защитила кандидатскую диссертацию по общей психологии. В 2003 г в Германии была удостоена степени Dr. habil. по когнитивной психологии (Institute of Psychology, Ruhr-University Bochum) и Venia legendi по когнитивной нейронауке (Otto-von-Guericke University Magdeburg), а в 2008 – стала профессором Хоуп Университета в Ливерпуле (Великобритания). С 2017 г является членом Академии высшего образования Великобритании.

Аннотация. В обзорном докладе будут затронуты следующие аспекты:

  • Функции и (кратко) эволюция цветового зрения.
  • Цвет как субъективное переживание (qualia).
  • Феномены восприятия цвета.
  • Две ведущие теории цветового зрения (Юнга-Гельмгольца, Геринга).
  • Нейронные механизмы: сетчатка (от фоторецепторов до ганглиозных клеток); НКТ; корковые центры: V1, V4, V8.
  • Врожденные цветоаномалии: генетическая основа.
  • Изменение цветоразличения в течение жизни.

Язык доклада – русский, но на слайдах презентации – английский, за что автор просит прощения у слушателей.

Ключевые слова:цветовое зрение, закономерности, теории, нейронные механизмы, аномалии цветовосприятия.

 

2 марта

Тема: Об аддитивной сложности классического и быстрого преобразований Хафа

Докладчик: Тимур Ханипов (м.н.с. лаборатории № 11 «Зрительные системы» ИППИ РАН).

Аннотация: Преобразование Хафа изображения размера n × n (определенной на двумерной целочисленной решетке функции, носитель которой содержится в квадрате n × n) сопоставляет каждой дискретной прямой из некоторого семейства сумму составляющих её пикселей (значений функции в соответствующих точках) аналогично тому, как преобразование Радона функции на плоскости сопоставляет непрерывным прямым линейные интегралы. На практике обычно рассматривают плотные семейства из Θ(n²) дискретных прямых с некоторой фиксированной параметризацией. Простейший алгоритм, вычисляющий преобразование Хафа для таких семейств, требует выполнения Θ(n³) сложений.

Быстрое преобразование Хафа (БПХ) является аппроксимацией классического преобразования Хафа, когда суммирование ведётся по “диадическим прямым”, которые чрезвычайно удобны с вычислительной точки зрения и в худшем случае уклоняются от “брезенхемовских” дискретных прямых как Θ(log n). БПХ вычисляется за Θ(n² log n) сложений и потому на практике активно применяется вместо классического преобразования Хафа там, где скорость обработки изображений является критическим фактором.

Ранее не были известны оценки аддитивной сложности вычисления преобразования Хафа кроме тривиальных Ω(n²) снизу и O(n³) сверху, также не имелось нетривиальных оценок снизу для аддитивной сложности БПХ. В докладе планируется изложить два результата, дающих некоторое продвижение в первом вопросе и с точностью до константы решающих второй:

1. С помощью известной оценки сложности реализации булевых линейных операторов будет показано, что ни одно из двух вышеперечисленных преобразований нельзя вычислить быстрее, чем за Θ(n² log n). Это, в частности, демонстрирует асимптотическую оптимальность стандартного алгоритма вычисления БПХ, причём константа в ограничении снизу всего на 5% отличается от константы сложности алгоритма.

2. Будет конструктивно доказано, что сложность вычисления классического преобразования Хафа ограничена сверху как O(n³ / log n). Предлагаемый способ построения вычислительной схемы состоит в декомпозиции прямых с близкими наклонами на общие части с сокращением на каждом шаге количества рассматриваемых наклонов вдвое (идейно он похож на алгоритм БПХ). Получающиеся в результате схемы могут иметь и меньшую, чем Θ(n³ / log n), сложность, это планируется проверить в ходе дальнейшего исследования. Интересно отметить, что при применении алгоритма к диадическим прямым естественным образом получается стандартный способ вычисления БПХ.

Подробнее с результатами можно ознакомиться по ссылкам http://arxiv.org/pdf/1801.01054.pdf и http://arxiv.org/pdf/1802.06619.pdf.

Ключевые слова: преобразование Хафа, быстрое преобразование Хафа, аддитивная сложность, задача вычисления семейства, дерево разбиений, сложность линейных булевых операторов.

 

28 февраля (среда)

Семинар проводится совместно с лаб. № 2, начало в 15:30

Тема: Представление диссертационной работы Новикова Анатолия Ивановича (доцент кафедры высшей математики, Рязанский государственный радиотехнический университет): «Разработка и исследование моделей и методов синтеза 2Dи 3изображений для систем технического зрения», подготовленной на соискание ученой степени доктора технических наук по специальности 05.13.17 – «Теоретические основы информатики».

 

 

 

18 января

Семинар будет посвящен философии науки

Тема: Обсуждение доклада Ф. Франка "Каково значение современных физических теорий для общей теории познания?"

Докладчик: Вахштайн Виктор Семенович, кандидат социологических наук, декан факультета социальных наук МВШСЭН, заведующий кафедрой теоретической социологии и эпистемологии философско-социологического факультета ИОН РАНХиГС.

Аннотация: Семинар будет посвящен тексту доклада Филиппа Франка "Каково значение современных физических теорий для общей теории познания?", опубликованного в журнале "Эркентнис" (Познание). (Полный текст сборника статей этого журнала доступен здесь: https://goo.gl/kP9ejm). Мы попробуем посмотреть, как в философии науки в результате развития физических теорий утверждается новое понимание "факта" и формируется новая - одновременно релятивистская и позитивистская - картина мира.

 

 

 

 

 

2017 

12 декабря 

Семинар пройдет на английском языке. Начало в 16:15.

Title: Morphological image processing and human vision sciences

Speaker: Akira Asano

CV: Akira Asano received his Ph.D in Applied Physics from Osaka University, Japan, in 1992. He is Professor of the Faculty of Informatics, Kansai University, Japan. He is now staying in Tampere University of Technology, Finland, as Visiting Research Fellow. He stayed in the IITP in September and October 1990 as a guest scientist, when he was a Ph.D candidate.

Abstract: I will introduce two topics of my research in this talk. One is mathematical morphology and its applications. Mathematical morphology is a fundamental framework of shape manipulation and has many applications to image processing. I will show our research on the applications to medical image processing and textile sciences. The other is our investigation of the relationships between visual stimuli and human behavior, especially preferences of colors and shapes shown to respondents. In this talk, the following subtopics are introduced:

1) Relationships between animations of evolving closed curves of various shapes presented to respondents and human activity of the sympathetic nervous system.
2) Temporarily transitional combinations of colors and emphasizing effects of their human impressions.
3) Influences of text alignments to human distinguishability of confusing Japanese/Chinese character pairs.

Key words: mathematical morphology, image processing, human vision


8 декабря

Тема: Представление диссертационной работы Кокорева Дениса Сергеевича «МОДЕЛИРОВАНИЕ ПРОЦЕССА ВПИСЫВАНИЯ МНОГОГРАННЫХ 3D-ОБЪЕКТОВ», подготовленной на соискание ученой степени кандидата технических наук по специальности 05.13.18 – «Математическое моделирование, численные методы и комплексы программ».

Аннотация: При решении многих прикладных задач возникает необходимость определять взаиморасположение различных геометрических объектов. Одной из задач в этой области является задача нахождения в трехмерном многограннике произвольной формы выпуклого многогранника наибольшего объема с заданными геометрическими свойствами. В диссертации дано расширенное определение для понятия вписывания многогранника в многогранник и предложена математическая модель процесса вписывания выпуклого трехмерного многогранника с заданными свойствами в невыпуклый многогранник. Проведено исследование различных численных методов и выбран алгоритм на базе метода внутренней точки, являющийся наиболее эффективным для решения поставленной задачи. На основе предложенной модели разработан и реализован комплекс программ, предназначенный для численного решения прикладных задач вписывания. С помощью разработанного программного комплекса создан алгоритм нахождения оптимального бриллианта в алмазе и его модификации, необходимые на разных стадиях обработки камня.

 

 


26 мая

Тема: Нейросетевые модели мультисенсорного детектора присутствия транспортного средства в зоне классификации пункта взимания платы.

Докладчик: Олег Масленников (студент НИУ ВШЭ).

Аннотация: В системе АКТС (Автоматический Классификатор Транспортных Средств) одну из важнейших ролей играет правильная детекция проездов транспортных средств, потому как от корректности найденных границ ТС зависит правильность дальнейшей работы алгоритмов классификации. В настоящее время в системе задача детекции проездов решается при помощи дополненной экспертными правилами “голосующей схемы”, использующей показания трех первичных детекторов, при которой проезд детектируется, если большая часть детекторов была активна. В докладе будет описан подход к решению задачи детекции проездов в системе АКТС с использованием полносвязных нейронных сетей, а также метод преобразования входных данных, являющихся временными рядами, в формат, необходимый для обучения ИНС.

Ключевые слова: детекция проездов, искусственные нейронные сети, машинное обучение.


 

19 мая

Тема: Сегментация регистрационных номеров автомобилей с помощью алгоритма динамической трансформации временной оси.

Докладчик: Михаил Поволоцкий (студент ФРТК МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация: При декомпозиции задачи распознавания автомобильных номеров распространено выделение этапа сегментации - поиска положений отдельных символов на вырезанном изображении номера. В докладе будет изложен быстрый алгоритм сегментации, устойчивый к неточностям локализации номера, а также искажениям яркости изображений. Алгоритм использует априорную информацию о геометрии стандартных типов номеров и дополнительно уточняет расположение символов путем оценки и корректировки ошибки локализации. Предлагается модель ошибки локализации номера, оптимальные параметры которой быстро вычисляются на основе динамического программирования. Также будет описана модификация алгоритма для одновременной сегментации и выбора оптимального типа (из априорно известного множества типов номеров). Будут приведены результаты вычислительных экспериментов, демонстрирующих эффективность предложенного подхода.

Ключевые словараспознавание номеров, сегментация номеров, динамическое программирование.

14 апреля 

Тема: Техника линейной кластеризации выборок малой (2-3) размерности с использованием быстрого преобразования Хафа

Докладчик: Егор Ершов (аспирант ФРТК МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация: Одним из известных инструментов, используемых в области обработки изображений, является быстрое преобразование Хафа (БПХ). Ценность данного алгоритма состоит в широком спектре его применимости: выделение прямолинейных границ, детекция точек схода, определение типа шрифта и так далее. В данном докладе будет изложен новый способ эксплуатации БПХ для решения задачи линейной кластеризации в дву- и трехмерных пространствах. Важной особенностью данного алгоритма является глобальная оптимальность результата. Для случая двух гауссовских смесей будет проиллюстрирована работа алгоритма, а также предложены некоторые критерии оптимального разделения.

Ключевые словабыстрое преобразование Хафа, аддитивные статистики, полный перебор, глобальная оптимизация, интегральное изображение.

7 апреля  

Тема: Богатый послеобраз как инструмент исследования механизмов стабильности зрительного поля

Авторы: И.М. Зенкин, А.П. Петров, А.М. Белокопытов (ИППИ РАН).

Аннотация: Использование положительных послеобразов в исследованиях функциональных свойств зрительной системы человека позволяет разрушить идеально согласованные оптические, глазодвигательные и нейронные процедуры, вовлеченные в многоуровневый зрительный процесс. Поскольку информационно-энергетический источник послеобраза «заморожен» на сетчатках глаз, из зрительного потока выпадают несколько важных «технологических» и сигнальных процессов. В этих искусственных для зрительной системы условиях проявляется деятельность важных глубинных уровней системы. Описание наблюдаемых феноменов и их возможная интерпретация составляют содержание настоящего доклада.

Ключевые словабогатый и бедный послеобраз, зрительное поле, движения глаз, иллюзии.

10 марта 

Тема: Подводная иллюзия как инструмент исследования механизмов бинокулярного стереосинтеза.

АвторыИ.М. Зенкин, А.П. Петров, С.Ю. Трифонов

АннотацияЛюбителям подводного плавания с маской хорошо известна иллюзия изменения размеров и расстояний в подводном зрительном поле. Это и есть хорошо известная в науке «подводная иллюзия». Анализ ее происхождения показал нам, что наличие плоскости раздела двух сред с разными коэффициентами преломления приводит к нарушению правил геометрической оптики для построения образа объекта в оптической системе. Это вынуждает зрительную систему, именно ее бинокулярный фузионный механизм, предпринимать «специальные усилия» для преодоления диплопии и синтеза адекватного зрительного поля. В докладе описываются детали этого процесса и сравниваются результаты модельных расчетов и экспериментальных данных.

Ключевые словазрительные иллюзии, механизмы стереосинтеза, стабильность зрительного поля, направление взора.

17 февраля

Распознавание отдельно стоящих строений на аэрофотоснимках

Докладчик: Ирина Кунина (аспирантка I года ФИВТ МФТИ, м.н.с. лаборатории №11 ИППИ РАН).

Аннотация: Рассматривается решение задачи распознавания единичных строений вне населенных пунктов на аэрофотоснимках в инфракрасном диапазоне. Под единичным строением понимается объект прямоугольной формы, расположенный отдельно от группы подобных объектов. Столь специфическая постановка актуальна, в частности, для поиска незаконных построек. В докладе будет описано решение данной задачи, состоящее из следующих этапов:
1. Поиск характерных особенностей (особых точек) на изображении c использованием детектора Харриса;
2. Проверка гипотезы о принадлежности конкретной особой точки углу строения на основе сверточных нейронных сетей (CNN);
3. Проверка гипотезы о принадлежности участка изображения, ограниченного заданной геометрической фигурой, строению, на основе CNN;
4. Геометрическая фильтрация результатов.

Ключевые словадешифровка изображений, аэрокосмические снимки, особые точки, сверточные нейронные сети.

20 января

Тема: Решение задачи управления скоростью движения автомобиля с электродвигателем.

Докладчик: Семёнов Илья (6 курс ФИВТ МФТИ, м.н.с. лаборатории 11 ИППИ РАН).

Аннотация:

В рамках семинара будут рассмотрены:
1. Основы теории управления и методы синтеза простых регуляторов;
2. Модель продольного движения автомобиля с электродвигателем UOT Electric March II;
3. Обзор различных типов регуляторов для управления скоростью;
4. Применение описанных методов к управлению скоростью движения робота-макета.

Ключевые словатеория управления, беспилотный электромобиль. 

2016

 

30 сентября  

Михаил Бабин (к.ф.-м.н., бывший сотрудник Google)

Теоретические обоснования глубинного обучения

Семинар посвящён "теоретическому" обоснованию глубинного обучения искусственных нейронных сетей (НС).
Планируется кратко рассмотреть следующие темы (от простых к более сложным):
1.      Универсальность НС как аппроксиматоров.
2.      PAC learning и Радемахеровская сложность НС.
3.      PAC-обучаемость НС множеству многочленов ограниченной степени.
4.      PAC-обучаемость случайных (упрощенных и не очень стандартных) НС-генеративных моделей.
5.      Обратимость генеративных моделей (тут уже обычные Relu + dropout feed forward НС).
6.      Близость локальных минимумов функции потерь НС к глобальному (при условии некоторых гипотез).

Ключевые слова: искусственные нейронные сети, глубинное обучение. 

24 июня

Лев Тепляков (студент 3-го курса ФРТК МФТИ)

Обзор методов извлечения локальных особенностей

Аннотация: Локальные особенности - это характерные участки изображения, отличающиеся от окрестности - углы, пятна, грани, однородные области. На семинаре для задачи извлечения особенностей будут рассмотрены требования к идеальному алгоритму, обсуждены существующие подходы к решению задачи и наиболее известные алгоритмы. Эти алгоритмы будут проанализированы на инвариантность относительно изменения масштаба, аффинных и проективных преобразований, что является одним из важнейших свойств локальных особенностей. Ввиду большой вычислительной сложности некоторых операций будут рассмотрены приближенные методы, позволяющие ускорить алгоритмы.

Ключевые слова: особая точка, инвариантные особенности, SURF, Harris, Hessian, DoG, MSER.

10 июня   

Алексей Савчик (аспирант ИППИ РАН)

Пересечение T и H поляр

В цикле статей про проективное распознавание овалов Николаевым П.П. были сформулированы некоторые гипотезы относительно овалов и возникающих при их рассмотрении объектов, например поляр в случае овала с выделенной точкой. Одну из гипотез, про количество точек пересечения поляр, удалось доказать. На семинаре будет сформулировано и доказано утверждение, что в общем случае точек пересечения T и H поляр хотя бы 3. Также будут сформулированы некоторые другие открытые гипотезы из статей Николаева П.П. Содержание доклада скорее математическое, но формул в нём не будет, больше иллюстрации и утверждения вроде "прямая в общем случае пересекает замкнутую кривую на плоскости в чётном числе точек". Доказательство основано на замечании, что точки пересечения касательных к графику с ним же топологически разбиваются на петли.

Ключевые слова: проективная плоскость, проективно инвариантные построения, T и H поляры овала, топологические соображения.

15 апреля

Елена Максимова (с.н.с. ИППИ РАН, лаб. 8)

Сетчатка как первичный центр обработки зрительной информации

Описание изображения внешнего мира, проектируемое оптикой глаза на растр рецепторов, передается в мозг по аксонам ганглиозных клеток (ГК) в виде разнообразных импульсных посылок. Описано к настоящему времени более двух десятков морфо-функциональных типов ГК, интерпретирующих, каждый по-своему, это изображение. Поле зрения, или рецептивное поле (РП) каждой ГК составляет около 3-10 угловых градусов.  Тип импульсной реакции ГК определяется спецификой ее синаптических связей (wiring) с рецепторами через биполяры (в наружном синаптическом слое) и биполяры и амакриновые клетки (во внутреннем синаптическом слое). Все поле зрения (вся рецепторная матрица) покрывается, как кафелем, РП всех типов ГК. Одни ГК реагируют на потемнение в их рецептивном поле (OFF-тип), другие - на посветление (ON- тип). Их импульсные посылки могут быть кратковременными (в момент включения или выключения стимула) или длящимися в течение всего действия стимула. Есть ГК вовсе не реагирующие на включение-выключение света. Они, однако, бурно реагируют на движение в их РП контрастных объектов. Это так называемые детекторы движения.  Есть несколько типов детекторов направления движения, детекторов ориентированных линий, детекторов мелких контрастных подвижных пятен. Аксоны разных типов ГК приходят в разные первичные зрительные отделы мозга (зрительные покрышки, коленчатое тело и т.д.), где они образуют ретинотопические проекции. Аксональные окончания разных типов ганглиозных клеток оканчиваются в разных слоях этих ядер, где и переключаются на собственно нейроны мозга. Там происходит дальнейшая обработка зрительного сигнала или переключение на нейроны, организующие соответственные поведенческие зрительно-обусловленные реакции. Так, например, известно, что детекторы пятна запускают пищевое поведение (у лягушек и рыб), а детекторы затемнения - оборонительное. Как устроены (напаяны) разные типы ГК и для чего они используются в поведении  -  вот два основных вопроса зрительной физиологии.

Ключевые слова: сетчатка, ганглиозные клетки, рецептивное поле, импульсы (спайки), синапсы, детекторы движения, первичные зрительные центры, зрительно-обусловленное поведение.

1 апреля

Алексей Алипер (и.о. м.н.с. ИППИ РАН, лаб. 8)

Строение и принципы организации сетчатки у позвоночных животных

Сетчатку справедливо называют частью мозга, выдвинутой на периферию. Двумерное инвертированное уменьшенное изображение внешнего мира на растре рецепторов каким-то образом трансформируется в представление о подвижном трехмерном мире. Как это происходит?  Ответ на этот вопрос пытаются найти морфологи и физиологи, полагая, что знание строения отдельных клеток, их связей и сигналов, при помощи которых они взаимодействуют, может помочь. Общий план строения сетчаток разных позвоночных животных был продемонстрирован более 100 лет назад. Сетчатка позвоночных состоит из трех ядерных и двух сетчатых слоев, образованных фоторецепторами, горизонтальными клетками, биполярными клетками, амакриновыми клетками и ганглиозными клетками. С тех пор это представление не поменялось, а современные методы лишь расширили наши знания об устройстве сетчатки. Во внешней сетчатке сигнал от рецепторов к биполярным клеткам, от биполярных клеток к ганглиозным передается неимпульсным путем. Там имеют место лишь медленные потенциалы, градуально зависящие от силы света. Ганглиозные клетки уже передают свой сигнал импульсами. Таким образом, во внутреннем синаптическом слое происходит перекодировка информации о свете. Ганглиозных клеток на данный момент известно множество типов, каждый из них имеет особенности структуры дендритного древа и обслуживается на входе своим набором биполярных и амакриновых клеток, что влияет на свойства выходного сигнала. Современные исследования сетчатки направлены на разрешение вопросов, как именно формируются ответы различных ганглиозных клеток, и какую задачу они могут решать в организации зрения.

Ключевые слова: сетчатка, зрение, ганглиозные клетки.

18 марта

Галина Рожкова

Морфологическая и функциональная неоднородность сетчатки человека: загадки крайней периферии

Хорошо известно, что сетчатка человека очень неоднородна: состав и плотность рецепторов и других клеточных элементов сильно меняются с изменением расстояния от заднего полюса глаза и различны для разных меридианов. Подавляющее число работ посвящено исследованию структуры и функции центральной области и «умеренной» периферии сетчатки. В то же время имеются интригующие и как бы противоречивые данные об особенностях самой крайней периферии. С одной стороны, давно обнаружено, что на границе сетчатки – вдоль её зубчатого края (ora serrata) – имеется кольцевая зона повышенной плотности колбочковых фоторецепторов, указывающая на возможную специфическую зрительную функцию крайней периферии, а с другой стороны, есть мнение, что примыкающая к ora serrata часть сетчатки является фактически слепой, и человек не воспринимает действующие на неё световые стимулы. Литература, посвященная крайней периферии сетчатки, немногочисленна и разнородна. В докладе будут представлены морфологические данные по крайней периферии сетчатки и рассмотрены различные гипотезы о возможном функциональном назначении колбочкового кольца и слепой зоны – обнаружение опасности, оценка оптического потока во время движения, вклад в константность цветовосприятия и др.

Ключевые слова: ora serrata, периферическая сетчатка, плотность рецепторов, обнаружение опасности, контроль локомоции, цветовая константность. 

11 марта

Даниил Кононенко (аспирант Сколтеха)

Система коррекции взгляда при видеоконференции, обучаемая по данным со слабой разметкой

Задача коррекции взгляда при видеоконференции поставлена как задача обучения с учителем. Предложен алгоритм решения, работающий в реальном времени и не требующий дополнительного оборудования кроме стандартной веб-камеры. Алгоритм основан на методе случайных лесов специального вида, обучающихся по данным со слабой разметкой. Предложен метод сбора и предобработки коллекции пар изображений, описывающих перевод взгляда и использующихся для обучения предложенного алгоритма. Обучение происходит на парах изображений лиц людей с фиксированной угловой разницей в направлении взгляда. В тест-тайме для человека не из обучающей выборки взгляд изменяется на тот же угол, что и в обучающей выборке.

Ключевые слова: монокулярная коррекция взгляда, машинное обучение, случайный лес, слабая разметка, глубокое обучение.

4 марта

Иван Коноваленко (аспирант ФРТК МФТИ, мнс лаб. 11 ИППИ РАН)

Основы стереозрения

Заседание проводится в связи с востребованностью заявленной темы при решении множества задач компьютерного зрения и не требует специальных предварительных знаний. В начале семинара в качестве необходимого введения будут разобраны вопросы, связанные с монозрением, такие как внутренние параметры камеры и проективная геометрия. На основной части семинара будут разобраны вопросы, относящиеся к стереозрению. Планируется обсуждение теории, популярных инструментов калибровки и типичных ошибок.

Ключевые слова: модель камеры, проективная геометрия, однородные координаты, эпиполярная геометрия, калибровка стереопары.

19 февраля 

Егор Ершов (аспирант МФТИ, м.н.с. лаб 11 ИППИ РАН)

Применение быстрого преобразования Хафа для разделения маломерных распределений. Трехмерное преобразование Хафа

Одним из классических инструментов в области обработки изображений является преобразование Хафа, но, к сожалению, наряду с известностью самого преобразования распространяется общепринятое клише, что данный инструмент обладает высокой вычислительной стоимостью, что, в свою очередь, служит плохую службу менее известному быстрому преобразованию Хафа.
На семинаре будет предпринята очередная попытка популяризации БПХ, представлен новый алгоритм трехмерного БПХ. На основе вышеизложенных алгоритмов построена схема пространственного разделения маломерных (2D или 3D) распределений, которая так же будет изложена на семинаре.

Ключевые слова: быстрое преобразование Хафа (БПХ), трехмерное преобразование Хафа, пространственное разделение.

Прошедшие заседания - 2015

НОВОСТИ И ОБЪЯВЛЕНИЯ
Семинар лаб.9 ИППИ РАН 22 октября, вторник, 11:00, ауд. 307. Алексей Викторович Чернавский (И...
В четверг 17 октября в малом конференцзале ИПЭЭ РАН в 14:30 на семинаре лаборатории №8 выступит Викт...
18 октября (пятница) состоится очередное заседание открытого семинара лаборатории № 11 на тему "Зрит...
В пятницу 19 июля в 17:00 в аудитории 615 ИППИ РАН состоится очередное заседание открытого семинара ...
21 июня, в пятницу Ю.Д.Апресян выступит с докладом "Взаимодействие лексики и грамматики". Место про...
Семинар Добрушинской математической лаборатории ИППИ РАН 18 июня, вторник, 16:00, ауд. 307. Fr...
7 июня (пятница) на совместном семинаре лаб. № 2 и лаб. № 11 состоится представление диссертации М.С...
В четверг 23 мая в малом конференцзале ИПЭЭ РАН в 14:30 на семинаре лаборатории №8 выступит Виктор И...
17 мая (пятница) состоится семинар лаб. № 11 на тему "Алгоритмы лингвистического процессора ЭТАП-4" ...
Семинар Добрушинской математической лаборатории ИППИ РАН 14 мая, вторник, 16:00, ауд. 307. М.Ц...
Все новости   
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2019
Об институте  |  Контакты  |  Старая версия сайта