На World AI&Data Challenge разработают алгоритм автоматической проверки «Тотального диктанта»

Фонд «Тотальный диктант» решил оптимизировать проверку онлайн-текстов с помощью нейронных сетей в рамках международного проекта World AI&Data Challenge, который АСИ запустило совместно с Всемирным банком. Об этом АСИ сообщила руководитель «Тотального диктанта» Ольга Ребковец.

Цель - сократить время и ресурсы на проверку текстов, а также расширить аудиторию проекта. Подать задачу на первый этап конкурса до конца марта 2020 года могут власти российских регионов, сообщества и владельцы данных, в том числе из других стран.

«Сегодня амбиции и деятельность проекта, а также запрос на образовательные программы настолько велик, что настало время иметь свою систему, которая бы оперативно адаптировалась под различные задачи, а мы бы могли еще активнее учить людей русскому языку. Участники ожидают от диктанта в онлайн-среде быстрой и технологичной проверки. Сейчас они получают свой результат через пять дней, мы же хотим сократить время до одного дня», – заявила она.

Для оптимизации фонд предоставил работы участников за 2017 и 2019 годы, тексты всех диктантов, комментарии филологов по пунктуационной и синтаксической разметке.

«Опыт конкурса цифровых решений в 2019 году показал, что data-сообщество включается в решение социальных задач страны, особенно если грамотно и четко поставлена задача и к ней подкреплены необходимые и интересные данные. В этом году постановщиками задач могут быть представители не только регионов, но и сообщества», - отметила директор центра цифрового развития АСИ Вера Адаева.

Одна из целей участия постановщика задачи в конкурсе – обеспечить онлайн-участникам не просто механическую проверку текстов (сверку с эталоном), а приблизить к реальной проверке филологов, в том числе учесть и грамматические ошибки.

«Мы видим интерес к повышению уровня грамотности в стране и понимаем насколько может быть важным решение этой задачи. Только за прошлый год в написании онлайн-диктанта приняло участие более 24 тысяч человек. У решения этой задачи, безусловно, есть большой потенциал и мы постараемся сделать так, чтобы она заинтересовала разработчиков и была максимально полезна для сообщества», – подчеркнула она.

С помощью конкурса «Тотальный диктант» сможет получить собственный алгоритм автоматической проверки текстов, который будет предусматривать все допустимые варианты написания слов и расстановки знаков препинания, а также снизит количество возможных ошибок системы. Также алгоритм может выполнять функции корректуры текстов и проверки на плагиат.