Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Машины будущего: как бизнесу продавать электрокары, и почему нам рано или поздно придется сказать им «да» Машины будущего: как бизнесу продавать электрокары, и почему нам рано или поздно придется сказать им «да»

Почему мы все еще не пересели на электромобили?

Inc.
Что нужно знать, чтобы избавиться от вредной привычки Что нужно знать, чтобы избавиться от вредной привычки

Можно ли легко избавиться от вредных привычек?

Psychologies
Эксперт Фомин рассказал, как предотвратить слежку за переписками на Android Эксперт Фомин рассказал, как предотвратить слежку за переписками на Android

Способы защиты переписок для пользователей Android-устройств

ТехИнсайдер
Мыслить как отступник Мыслить как отступник

Как шпионы становились шпионами и что они искали в других биографиях

Weekend
Плохой «ритм» сна связан с 83 болезнями Плохой «ритм» сна связан с 83 болезнями

Люди плохо представляют, сколько они на самом деле спят

ТехИнсайдер
Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино

Посмотрим на родственниц Мелани Гриффит, Шэрон Стоун и других знаменитостей

Cosmopolitan
10 вещей, которые должны быть в шкафу каждого взрослого мужчины 10 вещей, которые должны быть в шкафу каждого взрослого мужчины

Чтобы понять, взрослый ты мужчина или нет, достаточно влезть к себе в шкаф

Maxim
Редкий кадр: 7 женщин-режиссеров в истории «Оскара» Редкий кадр: 7 женщин-режиссеров в истории «Оскара»

За историю «Оскара» на статуэтку претендовали всего семь женщин-режиссеров

Forbes
Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного

Ученые разработали гипотезу происхождения Омуамуа, объясняющую его поведение

Популярная механика
От романа Яхиной до истории русских травести: 10 главных книг весны От романа Яхиной до истории русских травести: 10 главных книг весны

Писатель и литературный критик Сергей Кумыш выбрал 10 новых книг

РБК
Беседа Александра Эткинда и Сергея Сдобнова о книге «Природа зла. Сырье и государство» Беседа Александра Эткинда и Сергея Сдобнова о книге «Природа зла. Сырье и государство»

Диалог Александра Эткинда и Сергея Сдобнова

СНОБ
Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности

В чем секрет Илона Маска, может ли такой режим отдыха подойти обычному человеку

РБК
«Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей «Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей

Звезды. которые набрались смелости и сами выступили инициаторами разрыва

Cosmopolitan
Ирина Кооп-Шароватова Ирина Кооп-Шароватова

Участница легендарной арт-поп-группы «Колибри»

Собака.ru
Физики успешно измерили силу гравитации божьей коровки Физики успешно измерили силу гравитации божьей коровки

Физики измерили силу, с которой пространство-время искажает божью коровку

Популярная механика
Роман Должанский: Одоевское трехлучье Роман Должанский: Одоевское трехлучье

Новые главы из будущей книги Романа Должанского о путешествиях по России

СНОБ
Оторвали мишке лапу. Каким получился роман «Клара и Солнце» — первая книга Кадзуо Исигуро после Нобелевской премии Оторвали мишке лапу. Каким получился роман «Клара и Солнце» — первая книга Кадзуо Исигуро после Нобелевской премии

Какие темы затрагивает Кадзуо Исигуро и как читать «Клару и Солнце»?

Esquire
«Июльский дождь» 55 лет спустя. Главный фильм Марлена Хуциева снова в прокате «Июльский дождь» 55 лет спустя. Главный фильм Марлена Хуциева снова в прокате

«Июльский дождь» — главный фильм о хрущевской оттепели

СНОБ
Бумажный антистресс: шесть книг, которые согреют и успокоят Бумажный антистресс: шесть книг, которые согреют и успокоят

Книги, которые помогут дотянуть до весеннего солнца и ободряющего голубого неба

Seasons of life
Эти забавные халявщики: 15 животных, которые сделали ставку на человека и не прогадали Эти забавные халявщики: 15 животных, которые сделали ставку на человека и не прогадали

Многие животные вовсе не хотят жить на свободе в дикой природе

Maxim
Чужие страдания и тьма непознаваемого: фрагмент сборника эссе «Мужчины учат меня жить» американской писательницы и активистки Ребекки Солнит Чужие страдания и тьма непознаваемого: фрагмент сборника эссе «Мужчины учат меня жить» американской писательницы и активистки Ребекки Солнит

Фрагмент эссе Ребекки Солнит, посвященный Вирджинии Вульф

Esquire
Как опознать фейковый аккаунт в дейтинг-приложении? 6 способов, названных экспертами Как опознать фейковый аккаунт в дейтинг-приложении? 6 способов, названных экспертами

Как понять, что перед тобой реальная девушка, а не бот или мошенник?

Playboy
Дети мигрантов в российских школах: что будет дальше? Дети мигрантов в российских школах: что будет дальше?

Что происходит с классом, в котором половина учеников не говорит по-русски?

Psychologies
Идеи подарков на 8 Марта маме, которая сечет фишку: современные и технологичные штуковины специально для нее Идеи подарков на 8 Марта маме, которая сечет фишку: современные и технологичные штуковины специально для нее

Подборка девайсов, которые можно преподнести в подарок маме не только на 8 Марта

Playboy
От Самус до Трисс Мэригольд: главные секс-символы игр разных эпох От Самус до Трисс Мэригольд: главные секс-символы игр разных эпох

Вот о ком мечтали несколько поколений геймеров!

Maxim
14 фильмов о женщинах, сильных духом 14 фильмов о женщинах, сильных духом

Истории о независимых, талантливых, смелых и мудрых женщинах

РБК
Вся правда о Вся правда о

Кто задумывается о том, какой ценой достигается идеальное тело?

Cosmopolitan
Пять стадий Египта Пять стадий Египта

Пройдя все стадии принятия Египта, я был вознагражден

Вокруг света
Пять самых опасных насекомых Пять самых опасных насекомых

Теперь ты будешь относиться к насекомым еще хуже, чем раньше!

Maxim
Постсоветская эстетика, эпатаж модной индустрии и новая жизнь Balenciaga: что нужно знать о дизайнере Демне Гвасалии Постсоветская эстетика, эпатаж модной индустрии и новая жизнь Balenciaga: что нужно знать о дизайнере Демне Гвасалии

Что стоит знать о Демне Гвасалии

Esquire
Открыть в приложении