Систему распознавания марийской речи создали в Марий Эл, сейчас она проходит апробацию. Об этом рассказали на заседании правительственной комиссии по государственным языкам Марий Эл, сообщает "Марийская правда".
Система нужна для перевода речи в текст, а также создания голосовых помощников. Для этого был сформирован аудиокорпус с образцами марийской речи. В него вошли озвученные произведения как написанные на марийском языке, так и переведенные на него.
На сайте corp.marnii.ru размещен национальный корпус марийского языка, который включает в себя более 20 миллионов словоупотреблений. На базе языкового корпуса создаются монографические исследования, изданы "Словарь сравнений марийского языка" и "Словарь эпитетов марийского языка", начато составление "Словаря антонимов марийского языка". Набирает ход работа по созданию горномарийского подкорпуса Национального корпуса марийского языка.
В работе по цифровизации марийского языка принимают участие научные сотрудники, сотрудники Республиканского центра марийской культуры, студенты-практиканты МарГУ и ПГТУ, а также добровольцы-волонтёры.