В Яндекс Переводчике в скором времени появится мансийский язык. Ученые Югры уже передали в сервис корпус из 146 тысяч словосочетаний.
Вопрос о включении языка народа манси в популярный переводчик сейчас прорабатывает югорский НИИ информационных технологий совместно с департаментом информационных технологий и цифрового развития Югры, сообщил депутат региональной думы и известный писатель Еремей Айпин.
По его словам, в конце прошлого года в Федеральное агентство по делам национальностей и компанию Яндекс был направлен корпус в 146 тысяч пар предложений на мансийском и русском языках.
«Разработана нейросетевая модель машинного переводчика с русского на мансийский язык и обратно. Собранный корпус мансийского языка в 146 тысяч параллельных предложений позволил провести обучение модели автоматического перевода. Качество перевода, по оценке Института языкознания РАН, является достаточно хорошим»,
- написал депутат на своей ВК-странице.
В планах югорского НИИ информационных технологий - дальнейшее расширение корпуса параллельных предложений на мансийском и русском языке, обогащение корпуса графической информацией для сопровождения словаря мансийского языка.
В 2025 году планируется разработать голосовые модели распознавания и генерации мансийской речи. Ученые также хотят разработать генеративную модель мансийского языка, которая сможет вести письменный диалог, отвечая на вопросы и понимая культурные и языковые особенности народа манси.
Ранее «НацАкцент» писал, что в Яндекс Переводчике появятся карельский и вепсский языки.
«Новости с акцентом» теперь и в Телеграм!