Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научные подразделения >> Лаборатория № 3 >> Речевая группа

Состав группы: В.Н. Сорокин, И.С. Макаров, А.И. Цыплихин.

Исследуются условия решения речевых обратных задач. Это задачи определения формы речевого тракта, анатомических и артикуляторных параметров, команд управления артикуляцией, а также формы импульсов голосового возбуждения  по параметрам, измеренным на речевом сигнале. Эти задачи являются некорректными, поскольку принципиально допускают неоднозначные, а часто и неустойчивые решения. Тем не менее, для всех типов звуков удалось получить решения с погрешностью, сопоставимой с погрешностью измерения. Основой этих решений  являются математические модели речеобразования, которые, наряду с физиологически и анатомически адекватными ограничениями и специфическими регуляризаторами, используются в вариационном методе Тихонова. По результатам этих исследований, помимо монографий В.Н. Сорокина, опубликовано около 30 статей в Докладах Академии Наук, Акустическом журнале, электронном журнале «Информационные процессы», Speech Communication, Pattern Recognition and Image Analysis, и многих международных конференциях.

Экспериментальное доказательство возможности решения обратных задач с приемлемой точностью служит серьезным подтверждением теории внутренней модели, согласно которой процессы управления артикуляцией, обучения языку и распознавания речи человеком опираются на частично врожденную, а частично обученную модель процессов речеобразования.

Конструктивные алгоритмы, основанные на решении обратных  задач, открывают принципиально новые подходы к разработке речевых технологий. Предварительные эксперименты показывают, что качество артикуляторного синтеза речи сравнимо с качеством натуральной речи, возможно сжатие речевого сигнала до скоростей менее 2 кбит/с при полном сохранении разборчивости и индивидуальности речи, а суммарная вероятность ошибки верификации диктора по его голосу может быть ниже 0.01%. Также создаются совершенное новые возможности в разработке систем автоматического распознавания речи.

НОВОСТИ И ОБЪЯВЛЕНИЯ
Семинар Добрушинской математической лаборатории ИППИ РАН 16 октября, вторник, 16:00, ауд. 307. А...
12 октября в рамках "Пятничного семинара ИППИ РАН" выступит Никита Славнов (МИАН) с докладом по тем...
Семинар лаборатории № 8: 4 октября в 14:30 в ИПЭЭ РАН. В.М. Ольшанский. О возможной этологической фу...
Семинар Добрушинской математической лаборатории ИППИ РАН 2 октября, вторник, 16:00, ауд. 307. ...
Семинар лаб.№9 состоится 2 октября в 11:00 в ауд.307 Аруин А.С. АНТИСИПАТОРНЫЕ И КОМПЕНСАТОРНЫЕ НАСТ...
Защита докторской диссертации в совете Д.002.077.05: 01.10.2018 (понедельник), ауд.615 ИППИ...
Представление диссертационной работы Ершова Егора Ивановича «Вычислительные методы анализа изображен...
Robot navigation in dynamic environments. The open workshop of IITP RAS Lab 11 will start at 17:00 o...
Все новости   
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2018
Об институте  |  Контакты  |  Старая версия сайта