Корпус якутского языка запустят на основе базы толкового словаря в Якутии

Корпус якутского языка запустят на основе базы толкового словаря в Якутии

 
 
 
 
14 февраля 2020 в 14:00

Корпус якутского языка создадут в Республике Саха (Якутия). Об этом сообщает ЯСИА.

На данный момент сотрудники Института гуманитарных исследований и проблем малочисленных народов Севера СО РАН работают над созданием базы Большого толкового якутского словаря, который станет базой для будущего корпуса. В прошлом году вышел последний, 15-й том словаря, работа над которым продолжалась почти 50 лет. После этого глава региона Айсен Николаев дал поручение сделать его оцифровку.

В Корпус якутского языка будут включены примеры из художественной литературы, публицистики, устной речи и фольклора. Для расширения возможностей в состав программы внесены материалы из других словарей - фразеологических словарей Анатолия Нелунова и Никиты Григорьева, малого словаря Алексея Кулаковского-Ексекюляха и т.д.

Образцом для создания Корпуса был выбран Национальный корпус русского языка. В него включены образцы подростковой речи и творчество современных писателей.

Также в Институте гуманитарных исследований занимаются разработкой программы морфологических анализаторов, которая станет шагом к созданию искусственного интеллекта, думающего на якутском.

Ранее в честь 100-летия Удмуртской Республики был запущен национальный корпус удмуртского языка. Работает корпус башкирского языка.

Фото: ЯСИА

Материалы по теме:
3717