Проект "Корпус якутского языка" заработает в России в 2024 году. Пробная версия выйдет уже к концу года, рассказал ТАСС младший научный сотрудник Института гуманитарных исследований и проблем малочисленных народов Севера Сибирского отделения РАН Василий Бочкарев.
"Ведется работа над созданием "Корпуса якутского языка" со множеством дополнительных функций, с помощью которых можно обнаружить очень много доселе не изученных особенностей языка. Проект включает в себя тексты на якутском языке различных литературных жанров, где основой выступают фильтры и анализаторы, которые позволяют обработать миллионы данных за секунды, что было ранее невозможно при работе с классической картотекой", - поделился он.
Над созданием электронного корпуса работают ученые Республики Саха, им помогают представители Национальной библиотеки Якутии и Северо-Восточного федерального университета. Проект направлен не только на изучение якутского языка, но и его сохранение и развитие. С помощью корпуса можно составить словарь самых популярных слов якутского языка.
"Перед нами в первую очередь стоит задача научно обосновать возможность внедрения языка в мир компьютеров и реализация задуманного. Нашими продуктами являются не только конкретные программы, но и теория и базы, благодаря которым возможны будут будущие работы. Иными словами, наша работа должна стать катализатором еще большего количества новых, интересных и, главное, полезных работ, таким образом обеспечить сохранение и развитие якутского языка", - отметил ученый.
Ранее официальную регистрацию получил национальный корпус удмуртского языка.