В среду, 14 декабря, в 1500, в аудитории 307 состоится открытый семинар лаборатории зрительных систем и лаборатории цифровой документации русского языка.
Тема: Программная платформа Национального корпуса русского языка: опыт разработки
Докладчик: Сергей Александрович Гладилин, к.ф.-м.н., с.н.с. лаб. №11.
Аннотация: Программная платформа Национального корпуса русского языка (НКРЯ) — система, обеспечивающая возможность сложного поиска в представительных коллекциях текстов на русском языке, называемых языковыми корпусами. В докладе будет рассказано об опыте разработки корпусной платформы нового поколения для НКРЯ. Пользовательские требования к новой платформе, как правило, относились к двум категориям: «требуется сохранить то, как было в старой платформе» и «для такого-то частного случая требуется такая-то частная возможность». Вместе с тем, эмпирическое исследование платформы предыдущего поколения показало, что НКРЯ уже реализует большое количество частных функций и особенностей, зачастую узко-специфичных для конкретного языкового корпуса или группы корпусов. Программный код реализации предыдущего поколения содержал большое количество как правило не документированных развилок, учитывающих эти многочисленные особенности. В рамках разработки новой платформы был предложен ряд обобщающих моделей, позволивших описать особенности языковых корпусов как частные случаи. Это, в свою очередь, позволило построить программную систему в виде целостного ядра с настраиваемыми конфигурациями для разных языковых корпусов.
Семинар открытый, приглашаются все желающие!
К семинару будет возможность подключиться дистанционно, ссылка на трансляцию:
https://us02web.zoom.us/j/89032420765?pwd=bHQ4YnUyTE5mQXcwYWFmNTBkc08vUT09
12.12.2022 | |