Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Очаровательный кишечник Очаровательный кишечник

Как самый могущественный орган управляет нами

kiozk originals
Одиночки против корпораций: фантастические книги о борьбе человека и системы Одиночки против корпораций: фантастические книги о борьбе человека и системы

Герои этих романов бросают вызов могущественным корпорациям и государствам

Популярная механика
Осознанное потребление: берем пример с Лео ДиКаприо, Эммы Уотсон и Джейсона Момоа Осознанное потребление: берем пример с Лео ДиКаприо, Эммы Уотсон и Джейсона Момоа

Что делают знаменитости, которых заботят проблемы экологии?

Psychologies
Правила жизни Шакила О’Нила Правила жизни Шакила О’Нила

Шакил О’Нил планирует состариться в окружении телевизора и видеоигр

Esquire
Часовые тайги Часовые тайги

Что за лески мы видим на знакомых пейзажах лугов?

Наука и жизнь
Netflix, Spotify и публичные выступления: сколько стоят принц Гарри и Меган Маркл Netflix, Spotify и публичные выступления: сколько стоят принц Гарри и Меган Маркл

Как и из чего складывается доход принца Гарри и Меган Маркл

Forbes
Почему премия «Золотой глобус» отчаянно устарела Почему премия «Золотой глобус» отчаянно устарела

«Золотой глобус» — событие, на которое по-хорошему не нужно обращать внимания

СНОБ
Как понять, что твой кот тобой доволен Как понять, что твой кот тобой доволен

Сигналы, которые говорят о том, что твой кот счастлив

Maxim
Мать их не искала: как сложилась судьба детей скопинского маньяка Виктора Мохова Мать их не искала: как сложилась судьба детей скопинского маньяка Виктора Мохова

Как же сложилась судьба сыновей рязанского маньяка?

Cosmopolitan
Частоту атомных часов сравнили с рекордной точностью Частоту атомных часов сравнили с рекордной точностью

Это помогло ограничить существование легкой темной материи

N+1
Ворсинки ковра из алтайского кургана железного века рассказали о технологии стойкого окрашивания Ворсинки ковра из алтайского кургана железного века рассказали о технологии стойкого окрашивания

В волокнах Пазырыкского ковра ученые обнаружили следы обработки ферментацией

N+1
Рашид бен Саид аль-Мактум и Дубай: две утопии в одной реальности Рашид бен Саид аль-Мактум и Дубай: две утопии в одной реальности

Дубай — это соединение двух утопий

Weekend
«Не хватает маховика времени»: что мешает учителям использовать цифровые технологии «Не хватает маховика времени»: что мешает учителям использовать цифровые технологии

Отсутствие времени и доступной информации — главные проблемы учителей

Forbes
Топ-6 приложений для изучения английского языка Топ-6 приложений для изучения английского языка

Все, что понадобится для обучения английскому языку — смартфон и наушники

CHIP
Брильянты, балы и браки по расчету: британские сериалы про высшее общество Брильянты, балы и браки по расчету: британские сериалы про высшее общество

Британские сериалы о высшем свете

Cosmopolitan
Постлюбовная реабилитация: как забыть не отвечающую взаимностью девушку Постлюбовная реабилитация: как забыть не отвечающую взаимностью девушку

Прочти, прежде чем броситься с моста под поезд из-за невзаимной любви

Maxim
«Это что, заболевание, требующее лечения?» Узнали у депутата от «Единой России», зачем нужно запрещать аборты в частных клиниках «Это что, заболевание, требующее лечения?» Узнали у депутата от «Единой России», зачем нужно запрещать аборты в частных клиниках

Депутат Владимир Крупенников — о запрете абортов в России

СНОБ
Золотая жила: зачем сооснователь Reddit запустил платформу для торговли спортивными карточками Золотая жила: зачем сооснователь Reddit запустил платформу для торговли спортивными карточками

Alt может стать золотой жилой в мире коллекционных объектов

Forbes
Одна вокруг света: легенды Долины смерти и места славы U2 Одна вокруг света: легенды Долины смерти и места славы U2

113-ая серия о кругосветном путешествии Ирины Сидоренко и ее собаки Греты

Forbes
«Бедное искусство» за сотни тысяч евро: зачем покупать поролоновые скульптуры и арт-объекты из пепла «Бедное искусство» за сотни тысяч евро: зачем покупать поролоновые скульптуры и арт-объекты из пепла

Зачем художники создают скульптуры из хлеба и поролона?

Forbes
В чем сила, Джек? В чем сила, Джек?

Как история одной бандитской разборки рассказала о крахе Британской империи

Weekend
Все должно случиться Все должно случиться

Глеб Пускепалис впервые вышел на сцену в 1 год и с тех пор оттуда не уходит

OK!
Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного

Ученые разработали гипотезу происхождения Омуамуа, объясняющую его поведение

Популярная механика
Управляемое неудовлетворение и сложные переговоры с любителем астрологии. Как начинался Netflix (который чуть не стал NetPix) Управляемое неудовлетворение и сложные переговоры с любителем астрологии. Как начинался Netflix (который чуть не стал NetPix)

Отрывок из книги «That will never work» об истории Netflix

Inc.
Без купюр Без купюр

Актёр Хью Джекман о том, почему ему надоела роль супергероя

Grazia
Минута релакса: 11 легких способов уменьшить напряжение в шее и плечах, вызванное стрессом Минута релакса: 11 легких способов уменьшить напряжение в шее и плечах, вызванное стрессом

Пора немного размяться

Playboy
Илья Найшуллер: «В Америке все без иронии» Илья Найшуллер: «В Америке все без иронии»

Илья Найшуллер — об опыте работы в Америке и харассменте

Maxim
Том Холланд: «Я похудел, чтобы приблизиться к образу человека, который в отчаянии и предпочитает героин здоровому питанию» Том Холланд: «Я похудел, чтобы приблизиться к образу человека, который в отчаянии и предпочитает героин здоровому питанию»

Том Холланд — о новой роли в фильме братьев Руссо «По наклонной»

Esquire
«Люди людей еши» «Люди людей еши»

Неурожайные года и голод на Руси

Дилетант
Как эмиратские женщины запускают спутники и готовятся лететь в космос Как эмиратские женщины запускают спутники и готовятся лететь в космос

Зачем Арабским Эмиратам космическая программа и какую роль в ней играют женщины

Forbes
Открыть в приложении