Почему научить машину писать — легко, а искать ошибки в написанном — трудно

VC.RUHi-Tech

Обработка естественного языка: как создать «грамотного робота»

Узнали у разработчиков, почему научить машину писать — легко, а искать ошибки в написанном — трудно.

1280

Уже десяток российских команд включились в сложнейшую задачу по машинному обучению. Вот её условия:

Дано: реальные сочинения с ЕГЭ на двух языках — русском и английском. Их разметили школьные учителя: выделили смысловые блоки (аргументы, примеры, выводы) и нашли ошибки. В их числе — нарушение логики, искажение смысла, несоответствие теме.

1280

Задача: создать алгоритм, который сможет размечать такие же тексты и находить ошибки не хуже учителей. То есть разметка алгоритма должна отличаться от разметок педагогов не сильнее, чем разметки педагогов отличаются друг от друга. Язык можно выбрать на своё усмотрение.

Мы пообщались с тремя командами, работающими над решением.

  • «Антиплагиат» разработал одноимённый сервис обнаружения заимствований в текстах. В конкурсной команде эксперты в области машинного обучения, исследователи-алгоритмисты и специалисты по подготовке данных.
  • В составе команды «Наносемантика» — сотрудники «Нейросетей Ашманова» и системы проверки правописания «ОРФО»: нейросетевики, разработчики и лингвисты.
  • Команда DeepPavlov сформировалась во время работы над библиотекой разговорного AI DeepPavlov. Все участники — сотрудники лаборатории МФТИ.

Расскажите про своё решение. Какие ошибки оно уже определяет? Использовали в нём готовые модули или собственные наработки?

Антиплагиат: Делиться секретами до подведения хотя бы предварительных итогов было бы очень самонадеянно. Создание такого непростого алгоритма — задача творческая, каждая команда идёт к её решению особым путём.

Что касается результатов, то наш алгоритм приблизился к человеку в плане обнаружения грамматических ошибок.

Наносемантика: Конкурс лежит прямо в русле нашей работы. Мы развиваем одну из самых продвинутых систем проверки правописания — «ОРФО» — и как раз сейчас доделываем для неё английский граммер. А заодно экспериментируем с нейросетевыми модулями для выявления сложных ошибок — например, в расстановке артиклей, употреблении форм глагола или выборе слов из тех, которые для иностранца звучат похоже (steal вместо still или thin вместо thing).

Мы не стали ничего выдумывать, а просто попробовали подготовить бета-версию некоего продукта, напоминающего тот, который мы собираемся выпустить в будущем. Получилась в лучшем случае альфа (что тоже неплохо) — и, конечно, не хватило нескольких дней на то, чтобы выявить и исправить кучу крайне обидных ошибок. Не говоря уже о том, чтобы что-то отполировать.

Если в двух словах, то наше решение — соединение нейромодулей с традиционным граммером на правилах, который пока находит больше ошибок, но и сам ошибается чаще.

Это решение не было самым простым — кажется, мы знаем, как написать примитивную заглушку, которая формально дала бы результаты получше. И не удивлюсь, если какая-то из команд в условиях цейтнота так и поступила. Но мы заметно продвинулись в тех направлениях, в которых хотели продвинуться. Судя по разметке экспертов в доступных эссе, наша модель уже исправляет артикли не хуже среднестатистического учителя. Не знаем, насколько это серьёзный комплимент.

1280

На скриншоте — редкий пример текста, в котором найдено много ошибок. К другим эссе у нейросети претензий было меньше — часто одна-две, иногда ни одной. Сочинение, впрочем, действительно выдающееся: внимательный читатель, хотя бы немного знающий английский, легко найдёт в нём ошибки, которые наши модули пропустили.

Среди отмеченных ошибок, к сожалению, встречаются и ложные срабатывания. В предложении «дети предпочитают компьютерные игры обучению» нейросеть предлагает добавить местоимение (them), но тогда смысл исказится: «дети предпочитают играть в компьютерные игры, а не изучать их».

DeepPavlov: Мы использовали буквально всё, что могли, из нашей библиотеки и не только из неё. Для конкурса Alexa Prize от Amazon мы разработали DeepPavlov Agent — платформу для оркестрирования диалогов. Она отлично подошла и для этого конкурса и позволила нам совмещать несколько моделей, управлять ими и агрегировать результаты.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не думайте о покупателе: как вырастить стартап, который купит Apple Не думайте о покупателе: как вырастить стартап, который купит Apple

Что необходимо учитывать при создании стартапа, чтобы заинтересовать Apple

Forbes
Признаки жизни Признаки жизни

Получим ли мы когда-нибудь доказательства существования внеземных организмов?

Вокруг света
Форматы книг в зеркале живописи Форматы книг в зеркале живописи

Какие книги читали в разные времена представители разных сословий

Наука и жизнь
Ландшафт после американских выборов Ландшафт после американских выборов

Что может ждать США в новом политическом цикле

Эксперт
2002 год 2002 год

Теракт на Дубровке, футбольный погром, запуск «Масяни» и «Идущие вместе»

Esquire
Каверны: пустоты в дне судна, или как это работает Каверны: пустоты в дне судна, или как это работает

Вода для корабля – родная стихия. Но слишком вязкая

Популярная механика
Уроки латыни Уроки латыни

Демьян Кудрявцев, медиаменеджер и поэт, описывает Россию нулевых в стихах

Esquire
6 самых важных частей резюме, на которые стоит обратить внимание (и что в них указать) 6 самых важных частей резюме, на которые стоит обратить внимание (и что в них указать)

От этого могут зависеть твои шансы получить работу

Playboy
Главное — участие Главное — участие

Как домохозяйке основать международную бизнес-империю?

Forbes
5 вещей, которые удешевляют твой образ — избавься от них! 5 вещей, которые удешевляют твой образ — избавься от них!

Вещи, способные сделать любой образ "дешёвым"

Cosmopolitan
«Чем больше связей между двумя странами, тем легче осуществлять бизнес» «Чем больше связей между двумя странами, тем легче осуществлять бизнес»

Специфика работы в России подразделения крупной международной финансовой группы

РБК
2009 год 2009 год

Гибель Сергея Магнитского, закрытие Черкизовского рынка и новая Россия

Esquire
Выпьем за любовь Выпьем за любовь

Удастся ли винодельне «Долина Лефкадия» сломить предубеждение российской публики

Robb Report
Диета Магги: примеры рациона, результаты и противопоказания Диета Магги: примеры рациона, результаты и противопоказания

Диета Магги — что это такое, кому разрешена, а кому — запрещена

РБК
Елка дедушки Сережи Елка дедушки Сережи

Что доверяет Кремль «Спецмонтаж Предприятию 768»

Огонёк
Алкогений: Юрий Олеша Алкогений: Юрий Олеша

Юрий Олеша пил потому, что не знал, что делать в промежутках

Maxim
Сердца четырех Сердца четырех

Наше интервью с режиссером и актрисами сериала «Чики»

OK!
10 фобий, которые могут испортить ваш отпуск 10 фобий, которые могут испортить ваш отпуск

Мы изучили 10 главных страхов путешественника

Psychologies
Дмитрий Лиханов: Звезда и Крест. Отрывок из книги Дмитрий Лиханов: Звезда и Крест. Отрывок из книги

Фрагмент из романа Дмитрия Лиханова о том, как настоящее повторяет прошлое

СНОБ
Красота против времени. Самые необычные кладбища автомобилей Красота против времени. Самые необычные кладбища автомобилей

Экзотические автомобили, сквозь которые прорастает природа

РБК
Сотворение миллиардера. Эссе Пола Грэма о том, как пройти интервью в Y Combinator и стать богатым Сотворение миллиардера. Эссе Пола Грэма о том, как пройти интервью в Y Combinator и стать богатым

Пол Грэм рассказывает о том, как устроиться в Y Combinator

Inc.
Я к вам травою прорасту Я к вам травою прорасту

Как умереть, не нанося вред окружающей среде

Seasons of life
Gram против доллара Gram против доллара

Американская Комиссия по ценным бумагам и биржам закрыла проект Павла Дурова TON

Forbes
Эмоциональный интеллект для менеджеров проектов Эмоциональный интеллект для менеджеров проектов

Навыки работы с людьми, необходимые для достижения лучших результатов

kiozk originals
Ученые доказали, что лежать на диване, ругаться и есть жирное — полезно, а убираться в доме и часто мыться — вредно Ученые доказали, что лежать на диване, ругаться и есть жирное — полезно, а убираться в доме и часто мыться — вредно

Если ты, небритый, лежишь на диване, сигареты куришь, получай наслаждение

Maxim
#тело #тело

Средства, которые и успокоят, и взбодрят, и защитят от вирусов

Glamour
Дух рождества Дух рождества

В самом немецком из французских городов Рождество отмечают пышно и со вкусом

Лиза
Настоящее удовольствие для каникул: новый фильм Вуди Аллена «Фестиваль Рифкина» Настоящее удовольствие для каникул: новый фильм Вуди Аллена «Фестиваль Рифкина»

«Фестиваль Рифкина» — Луи Гаррель, хороший юмор и испанское побережье

Forbes
Правила жизни Жана-Люка Годара Правила жизни Жана-Люка Годара

Правила жизни режиссера «новой волны» Жана-Люка Годара

Esquire
Телефон доверия: кто и как использует подмену мобильных номеров Телефон доверия: кто и как использует подмену мобильных номеров

Технологию подмены номера используют как крупные компании, так и мошенники

Forbes
Открыть в приложении