Корпус якутского языка создадут в Республике Саха (Якутия). Об этом сообщает ЯСИА.
На данный момент сотрудники Института гуманитарных исследований и проблем малочисленных народов Севера СО РАН работают над созданием базы Большого толкового якутского словаря, который станет базой для будущего корпуса. В прошлом году вышел последний, 15-й том словаря, работа над которым продолжалась почти 50 лет. После этого глава региона Айсен Николаев дал поручение сделать его оцифровку.
В Корпус якутского языка будут включены примеры из художественной литературы, публицистики, устной речи и фольклора. Для расширения возможностей в состав программы внесены материалы из других словарей - фразеологических словарей Анатолия Нелунова и Никиты Григорьева, малого словаря Алексея Кулаковского-Ексекюляха и т.д.
Образцом для создания Корпуса был выбран Национальный корпус русского языка. В него включены образцы подростковой речи и творчество современных писателей.
Также в Институте гуманитарных исследований занимаются разработкой программы морфологических анализаторов, которая станет шагом к созданию искусственного интеллекта, думающего на якутском.
Ранее в честь 100-летия Удмуртской Республики был запущен национальный корпус удмуртского языка. Работает корпус башкирского языка.
Фото: ЯСИА