МГУ и «Яндекс» создали метод обучения нейросетей сложным правилам русского языка
LORuGEC — первый открытый набор данных с примерами ошибок по сложным правилам русского языка.
Над разработкой трудились исследователи Института ИИ МГУ и «Яндекса». LORuGEC учит нейросети исправлять грамматические, орфографические и пунктуационные ошибки в текстах.
Внутри — 348 проверочных и 612 тестовых предложений, которые демонстрируют сложные правила русского языка, включая примеры с неверной пунктуацией, ошибки в написании слов с «не» и согласовании сказуемого и подлежащего в сложных предложениях.
Новый метод уже протестировали на моделях YandexGPT 5 Lite, YandexGPT 5 Pro и зарубежных аналогах.
Какой итог:
- стандарт оценки грамматики F0,5: точность исправлений выросла на 5−10%;
- общая точность YandexGPT 5 Pro: 83%;
- общая точность YandexGPT 5 Lite: 71%.
Источники
Понравилась статья?
Теги статьи
Похожие статьи
Нам нравится, что вам нравится
Уверены, вы можете не хуже! Напишите статью и получите Бонусы.
Спасибо, что вам есть что сказать
Попробуйте расширить свою мысль и написать статью — и получите за это Бонусы.
Комментарии
Авторизуйтесь, чтобы иметь возможность писать комментарии:
Войти