ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научные подразделения >> Лаборатория № 3 >> Речевая группа

Состав группы: В.Н. Сорокин, И.С. Макаров, А.И. Цыплихин.

Исследуются условия решения речевых обратных задач. Это задачи определения формы речевого тракта, анатомических и артикуляторных параметров, команд управления артикуляцией, а также формы импульсов голосового возбуждения  по параметрам, измеренным на речевом сигнале. Эти задачи являются некорректными, поскольку принципиально допускают неоднозначные, а часто и неустойчивые решения. Тем не менее, для всех типов звуков удалось получить решения с погрешностью, сопоставимой с погрешностью измерения. Основой этих решений  являются математические модели речеобразования, которые, наряду с физиологически и анатомически адекватными ограничениями и специфическими регуляризаторами, используются в вариационном методе Тихонова. По результатам этих исследований, помимо монографий В.Н. Сорокина, опубликовано около 30 статей в Докладах Академии Наук, Акустическом журнале, электронном журнале «Информационные процессы», Speech Communication, Pattern Recognition and Image Analysis, и многих международных конференциях.

Экспериментальное доказательство возможности решения обратных задач с приемлемой точностью служит серьезным подтверждением теории внутренней модели, согласно которой процессы управления артикуляцией, обучения языку и распознавания речи человеком опираются на частично врожденную, а частично обученную модель процессов речеобразования.

Конструктивные алгоритмы, основанные на решении обратных  задач, открывают принципиально новые подходы к разработке речевых технологий. Предварительные эксперименты показывают, что качество артикуляторного синтеза речи сравнимо с качеством натуральной речи, возможно сжатие речевого сигнала до скоростей менее 2 кбит/с при полном сохранении разборчивости и индивидуальности речи, а суммарная вероятность ошибки верификации диктора по его голосу может быть ниже 0.01%. Также создаются совершенное новые возможности в разработке систем автоматического распознавания речи.

НОВОСТИ И ОБЪЯВЛЕНИЯ
Научный сотрудник лаборатории обработки сенсорной информации Марина Кочевалина получила диплом канди...
5 марта в совете 24.1.101.01 ИППИ РАН состоялась успешная защита докторской диссертации младшего нау...
Совместный семинар ИПЭЭ РАН и ИППИ РАН по проблемам сенсорной физиологии: 28 марта (четверг), 14:30,...
Московский телекоммуникационный семинар: 5 апреля (пятница), 17:00, онлайн. Роман Бычков (Сколтех) «...
Во вторник 26.03.2024 в 14:00 в ауд 307 планируется доклад профессора Игоря Потемкина (физфак МГУ) "...
Открытый семинар сектора репродукции и синтеза цвета: 21 марта (четверг), 17:00, ауд. 307. Владимир ...
Семинар «Глобус»: 21 марта (четверг), 15:40, ауд. 401 НМУ. Александра Скрипченко (ВШЭ) «Задача Новик...
Еще двое сотрудников лаборатории беспроводных сетей ИППИ РАН — аспирант Антон Карамышев и студент ма...
Все новости   
 

 

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2024
Об институте  |  Контакты  |  Противодействие коррупции