Интерактивную базу древнеславянских текстов создадут российские ученые при участии комиссии по работе с вузами и научным сообществом с помощью технологий искусственного интеллекта. Об этом сообщают РИА Новости со ссылкой на пресс-службу НИТУ "МИСиС".
Совместную работу проделают ученые из Института русского языка им. В.В. Виноградова РАН, НИТУ "МИСиС" и НИУ ВШЭ при участии комиссии по работе с вузами и научным сообществом при Епархальном совете Москвы. После создания корпуса древнеславянского языка у исследователей-лингвистов и историков появится инструмент для изучения всех современных национальных славянских языков и культур, ключ к пониманию их наследия.
Корпус — это структурированная база данных языка, информационно-справочная система, которая основана на собрании в электронной форме текстов на определенном языке. Корпус представляет собой подобранную и обработанную совокупность текстов, использующихся в качестве основы для исследования лексики и грамматики языка.
Проект начнется с оцифровки и разметки комплекса древнеславянских миней XI-XVII веков на древнерусском, болгарском и сербском языках — служебных церковных книг, которые содержат распорядок служб всех дней церковного года. Рукописи книг хранятся в собраниях Государственного исторического музея, Российской национальной и государственной библиотек, Российского государственного архива древних актов, Свято-Троицкой Сергиевой лавры.