Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english

Семинар по теоретической семантике

В пятницу 17.03.2017, в 16.00 в зале заседаний ученого совета ИППИ РАН выступит с докладом Александр Пиперски (Институт лингвистики РГГУ, Школа филологии НИУ ВШЭ).

Тема доклада: "Разные методы сравнения корпусов на основе частотных словарей".

Краткая аннотация:

Оценка близости корпусов на основе мер частотности активно разрабатывается в корпусной лингвистике уже два десятилетия (ср., в частности, работы А. Килгарриффа и А. Я. Шайкевича). В докладе предлагается оценка существующих мер (хи-квадрат, коэффициент корреляции Спирмена, сумма минимальных частот, близость по ключевым словам) с помощью корпусов известной степени сходства (Known-Similarity Corpora), а также обсуждается, на единицах какого уровня (символьные n-граммы, словоформы, леммы) сравнение оказывается наиболее качественным. В качестве примера 
исследования, для которого полезно измерять близость корпусов, проводится анализ языка русской поэзии: для сравнения берутся корпуса различных русских поэтов, и полученный результат сопоставляется с известными данными из истории литературы.

Страничка семинара: http://iitp.ru/ru/science/seminars/369.htm


15.03.2017 | Тимошенко Светлана Петровна
 

 

  © Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2017
Об институте  |  Контакты  |  Старая версия сайта