Социальная сеть "ВКонтакте" тестирует нейросеть, автоматически распознающую материалы с враждебными высказываниями (хейтспичем). За первую половину 2020 года руководство соцсети удалило 520 тыс. единиц контента, связанного с разжиганием вражды и ненависти, говорится в сообщении компании.
В соцсети считают, что нейросеть позволит быстрее находить материалы с враждебными высказываниями, а также провоцирующие на агрессию публикации.
"Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний", - уточняют там.
Для усиления модерации по теме языка ненависти и обучения искусственного интеллекта "ВКонтакте" добавила новую категорию жалоб "враждебные высказывания". Теперь будут точнее откалиброваны уже существующие инструменты и собран набор данных для новых решений на основе нейросетей.
Также модераторы "ВКонтакте" проведут проактивный внутренний мониторинг с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.