ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научные подразделения >> Лаборатория № 3 >> Речевая группа

Состав группы: В.Н. Сорокин, И.С. Макаров, А.И. Цыплихин.

Исследуются условия решения речевых обратных задач. Это задачи определения формы речевого тракта, анатомических и артикуляторных параметров, команд управления артикуляцией, а также формы импульсов голосового возбуждения  по параметрам, измеренным на речевом сигнале. Эти задачи являются некорректными, поскольку принципиально допускают неоднозначные, а часто и неустойчивые решения. Тем не менее, для всех типов звуков удалось получить решения с погрешностью, сопоставимой с погрешностью измерения. Основой этих решений  являются математические модели речеобразования, которые, наряду с физиологически и анатомически адекватными ограничениями и специфическими регуляризаторами, используются в вариационном методе Тихонова. По результатам этих исследований, помимо монографий В.Н. Сорокина, опубликовано около 30 статей в Докладах Академии Наук, Акустическом журнале, электронном журнале «Информационные процессы», Speech Communication, Pattern Recognition and Image Analysis, и многих международных конференциях.

Экспериментальное доказательство возможности решения обратных задач с приемлемой точностью служит серьезным подтверждением теории внутренней модели, согласно которой процессы управления артикуляцией, обучения языку и распознавания речи человеком опираются на частично врожденную, а частично обученную модель процессов речеобразования.

Конструктивные алгоритмы, основанные на решении обратных  задач, открывают принципиально новые подходы к разработке речевых технологий. Предварительные эксперименты показывают, что качество артикуляторного синтеза речи сравнимо с качеством натуральной речи, возможно сжатие речевого сигнала до скоростей менее 2 кбит/с при полном сохранении разборчивости и индивидуальности речи, а суммарная вероятность ошибки верификации диктора по его голосу может быть ниже 0.01%. Также создаются совершенное новые возможности в разработке систем автоматического распознавания речи.

НОВОСТИ И ОБЪЯВЛЕНИЯ
В среду 19 июня в г. Ханты-Мансийске в рамках VI Международной конференции «Информация и коммуникаци...
Сотрудники ИППИ РАН стали победителями конкурсного отбора на назначение новой стипендии Президента Р...
В продолжение цикла лекций 27 июня (четверг) пройдёт семинар "Информационные проблемы искусствен...
Во вторник 18 июня сотрудники Института проблем передачи информации им. А.А. Харкевича РАН приняли у...
Скоро стартует Летняя школа по анализу данных ИППИ РАН 2024 ! Летняя школа — это возможность поработ...
В четверг 20 июня в 17:00 (аудитория 307 ИППИ) пройдет Семинар сектора репродукции и синтеза цвета №...
В четверг 13 июня в главном здании БЕН РАН состоялась первая из серии лекций «Пионеры цифровой эпох...
В четверг 13 июня в 17:00 (аудитория 307 ИППИ) пройдет Семинар сектора репродукции и синтеза цвета №...
Все новости   
 

 

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2024
Об институте  |  Контакты  |  Противодействие коррупции