Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english

Открытый семинар лаборатории №11

В среду, 2 ноября, в 1500 в аудитории 307 состоится открытый семинар лаборатории зрительных систем.

 

Тема: Методы проективной локализации документов с неизвестным шаблоном на изображении, полученном с камеры мобильного устройства (по материалам диссертации на соискание степени к.т.н.)

 

Докладчик: Даниил Вячеславович Тропин, ФИЦ ИУ РАН и ООО "Смарт Энджинс Сервис"

 

Аннотация: При распознавании документов по изображениям, полученным с камер мобильных телефонов, если не требовать аккуратного предъявления документа в строго определенном ракурсе, образ документа подвергается проективным искажениям. Локализация четырехугольника внешних границ документа позволяет устранить проективные искажения и свести задачу к хорошо исследованной задаче распознавания сканов документов. Существующие методы локализации документов обладают рядом недостатков. Например, для некоторых из них свойственна неточная работа в случае, когда неинформативная часть документа выходит за пределы кадра или когда необходимо локализовать сразу несколько страниц одного документа.


В диссертации предложен алгоритм проективной локализации документа с неизвестным шаблоном и заполнением. Установлено, (i) что среднее время обработки одного кадра этим алгоритмом на мобильном процессоре телефона iPhone 6 составляет 0.1 секунды на кадр и (ii) что средняя точность по метрике локализации Жаккара составляет от 0.90 до 0.99 (в зависимости от тестового датасета), что превышает по точности локализации известные на момент публикации алгоритмы аналогичного класса, в том числе те, которые разрабатывались без ограничений вычислительной сложности. Также в диссертации предложен двухэтапный алгоритм проективной локализации страниц документа типа «буклет» с неизвестным шаблоном, но известной ортотропной структурой заполнения, первый этап которого заключается в проективной ректификации изображения страницы, а второй — в доопределении с помощью детектора Виолы-Джонса неизвестных параметров образа страницы. Установлено, что благодаря использованию предложенного алгоритма число ошибок локализации сократилось на 73% относительно версии, в которой выполнялся лишь второй этап.

 

Семинар открытый, приглашаются все желающие!

К семинару будет возможность подключиться дистанционно через google meet, ссылка на трансляцию: https://meet.google.com/jzc-qyte-ypv.

 

 

31.10.2022 | Ефимова Мария
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2022
Об институте  |  Контакты  |  Старая версия сайта