ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english
Научная деятельность >> Прикладные разработки >> МНОГОЦЕЛЕВОЙ ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР Э...

Лингвистический процессор ЭТАП-3 – это компьютерная система, обладающая большим объемом знаний о Естественном Языке вообще и о русском и английском языках в частности. Благодаря этим знаниям и соответствующим алгоритмам ЭТАП-3 может анализировать тексты, написанные на этих языках, и самостоятельно строить такие тексты по исходному смысловому заданию. На основе ЭТАПа-3 осуществлены четыре  прикладные разработки  - система машинного перевода (http://proling.iitp.ru ),  конвертор/деконвертор семантического языка UNL (http://unl.ru/deco.html ), компьютерный учебник лексики и синтаксически размеченный корпус русских текстов СинТагРус (http://ruscorpora.ru/instruction-syntax.html).

1. Система машинного перевода умеет переводить тексты с русского языка на английский и с английского на русский. Она располагает словарями этих языков, достигающими 100 тысяч лексических единиц каждый, и несколькими массивами правил анализа, синтеза и перевода текстов. От других систем аналогичного назначения система отличается в первую очередь тем, что опирается на целостную лингвистическую теорию «Смысл Текст».

 

Рис. 1. Пример работы системы машинного перевода ЭТАП-3.

В верхнем поле рабочего окна системы - русское предложение, в нижнем – его перевод на английский язык.

 

 

Рис. 2. Синтаксическая структура русского предложения в виде дерева зависимостей – главный результат синтаксического анализа, к которому и применяются правила перевода. Все слова предложения представлены своими именами (они в прямоугольниках) и наборами грамматических характеристик – часть речи, род, число, падеж и др. (справа от прямоугольников). Каждое слово, за исключением абсолютной вершины предложения (на рисунке это слово удалось), подчиняется какому-то другому слову по некоторому синтаксическому отношению (имена отношений – в полях овальной формы).

 

2.  Конвертор/деконвертор семантического языка UNL способен  преобразовывать русские и английские тексты в их семантические представления на языке UNL и осуществлять обратную операцию – синтезировать русские или английские тексты по семантическому представлению. Эти модули входят в состав системы многоязычного общения, в которую помимо них входят конверторы и деконверторы французского, испанского, арабского, хинди и некоторых других языков, разработанные нашими партнерами. На рис. 3 можно видеть семантическое представление русского предложения В феврале в Москве состоится международная конференция, посвященная юбилею этого выдающегося ученого  в виде графа UNL.

 

Рис. 3. Пример семантического графа. В верхнем поле семантический граф, в нижнем – соответствующее ему русское предложение.

 

3.  Следующая прикладная разработка, выполненная на базе лингвистических знаний процессора ЭТАП-3, - это компьютерный учебник лексики, предназначенный как для иностранцев, так и для тех, кто хочет усовершенствовать свое знание родного языка. Предмет изучения – сложные аспекты лексическойс истемы языка (так называемые лексические функции), связанные в первую очередь с правилами сочетаемости слов, которые не охватываются никакими традиционными учебными методиками. Учебник построен как набор интерактивных игр, в которых  система задает пользователю вопросы разных уровней сложности, в случае необходимости делает подсказки и выставляет оценки. На рис. 4 показан один из моментов игры «Угадай лексическую функцию». 

 

Рис. 4. Игра «Угадай лексическую функцию». Пользователю предъявлены примеры значений лексической функции MAGN («большая степень чего-либо»: брюнет– жгучий, тьма - кромешная) и предлагается определить значение этой функции от слова битва.

 

4.  Корпус текстов СинТагРус – это первый корпус русскогоя зыка, в котором каждому предложению приписана его полная морфологическая и синтаксическая структура (наподобие представленной на рис. 2). В настоящее время корпус содержит около 40 тыс. предложений (приблизительно 600 тысяч слововхождений). Разметка текстов производится в полуавтоматическом режиме: вначале модуль синтаксического анализа процессора ЭТАП-3 строит для каждого предложения его синтаксическую структуру, а затем эта структура проверяется и при необходимости редактируется экспертом-лингвистом. Благодаря такой организации работы достигается высокое качество разметки корпуса. СинТагРус используется как в теоретических исследованиях в области языкознания, так и в практических задачах обработки текстов на естественном языке (в частности, для целей машинного обучения статистических анализаторов русского текста).

 

 

 

 

 

 

 

НОВОСТИ И ОБЪЯВЛЕНИЯ
8 декабря, в библиотеке-отделе БЕН в ИППИ открылась выставка «Лучшие научные статьи 2023. Ученые рек...
Семинар Добрушинской математической лаборатории ИППИ РАН 12 декабря, вторник, 16:00, ауд. 307 (оч...
12 декабря, вт., в 14:00 (мск) на онлайн семинаре "Вероятность и математическая статистика (семинар ...
В четверг 7 декабря в 14:30 на семинаре Лаборатории № 8 доклад П.А. Чочиа. История исследований в ла...
Минобрнауки России объявляет старт конкурсного отбора на предоставление грантов для проведения крупн...
И.о. директора ИППИ РАН Максим Федоров выступил на пленарном заседании IX всероссийской конференции ...
Биологи из группы геномики растений — неформальной коллаборации научных сотрудников ИППИ РАН и Сколт...
Семинар Добрушинской математической лаборатории ИППИ РАН 5 декабря, вторник, 16:00, ауд. 615 (очн...
В понедельник 4 декабря 2023 года в 11.00 в зале заседаний Ученого совета состоится очередное заседа...
Заместитель директора по науке Владимир Потапов и заведующий лабораторией беспроводных сетей Евгений...
Московский телекоммуникационный семинар: 1 декабря (пятница), 17:00, онлайн. Екатерина Степанова «Ис...
Семинар сектора репродукции и синтеза цвета: 30 ноября (четверг), 17:00. Павел Максимов «Аномалии цв...
В четверг 30 ноября в 14:30 на семинаре Лаборатории № 8 доклад В.Л. Дунина-Барковского. О механизмах...
28 ноября, вт., в 14:00 (мск) на онлайн семинаре "Вероятность и математическая статистика (семинар т...
Поздравляем заведующего лабораторией математических основ машинного обучения ИППИ РАН Александра Гас...
В Москве состоялось заседание Попечительского совета Института демографической политики имени Д. И. ...
РНФ начинает прием заявок на «молодежные» конкурсы Президентской программы исследовательских...
В Москве в эти дни проходит международная онлайн-конференция Сбербанка по искусственному интеллекту ...
Московский телекоммуникационный семинар: 24 ноября (пятница), 17:00, онлайн. Михаил Любогощев "Разра...
Открытый семинар лаборатории зрительных систем: 23 ноября (четверг), 15:00, ауд. 615. Галина Рожкова...
Все новости   
 

 

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2023
Об институте  |  Контакты  |  Противодействие коррупции