Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Всегда желанные Всегда желанные

Как сохранить страсть в длительных отношениях

kiozk originals
Дело Деми Мур: Почему нас так задевает чужая внешность Дело Деми Мур: Почему нас так задевает чужая внешность

За что осудили Деми Мур и почему нам вообще есть дело до чужой внешности

Домашний Очаг
Бодипозитив не заставляет нас переедать: мнение психолога Бодипозитив не заставляет нас переедать: мнение психолога

Влияние извне не заставит нас заедать проблемы, если мы умеем справляться с ними

Psychologies
Игры с разумом Игры с разумом

На что гаджеты действительно способны и что нам за это будет

Vogue
Скорая помощь: травяные сборы от отеков, которые спасут лицо после вечеринки Скорая помощь: травяные сборы от отеков, которые спасут лицо после вечеринки

Что делать, если все лицо опухло, а под глазами отеки?

Cosmopolitan
От романа Яхиной до истории русских травести: 10 главных книг весны От романа Яхиной до истории русских травести: 10 главных книг весны

Писатель и литературный критик Сергей Кумыш выбрал 10 новых книг

РБК
Иконы стиля: Грейс Келли, Жаклин Кеннеди и другие первые леди, изменившие моду Иконы стиля: Грейс Келли, Жаклин Кеннеди и другие первые леди, изменившие моду

Легендарные женщины, оказавшие огромное влияние на модную индустрию

Cosmopolitan
6 продуктов, срок годности которых никогда не истечет 6 продуктов, срок годности которых никогда не истечет

Список еды, которую ты можешь завещать своим внукам, если совсем их не любишь

Maxim
Часы марсианского тракториста Часы марсианского тракториста

Когда и зачем человеку может понадобиться новая система измерения времени?

Вокруг света
20 лет спустя 20 лет спустя

Алексей Чадов — о том, каково ему на новом «фронте»

OK!
«Во сне я без страха пою и танцую»: рассказ об Исламской революции в Алжире через истории женщин «Во сне я без страха пою и танцую»: рассказ об Исламской революции в Алжире через истории женщин

«Лапочка» — первый полный метр франко-алжирского режиссера Мунии Меддур

Forbes
Дома поговорим: как Букингемский дворец спустил на тормоза конфликт с Меган и Гарри Дома поговорим: как Букингемский дворец спустил на тормоза конфликт с Меган и Гарри

Как отнеслись к откровениям Меган Маркл и Гарри в королевстве?

Forbes
Суперпозиция электронного состояния изменила свойства тормозного излучения Суперпозиция электронного состояния изменила свойства тормозного излучения

Физики рассчитали рассеяние электрона на атоме углерода и на нано-ондуляторе

N+1
Отрывок из книги Киры Ярмыш, презентацию которой исключили из программы ярмарки Non/fiction Отрывок из книги Киры Ярмыш, презентацию которой исключили из программы ярмарки Non/fiction

Фрагмент из книги Киры Ярмыш «Невероятные происшествия в женской камере №3»

СНОБ
Zнак беZграничность. О новом альбоме «Бордерлайн» Zнак беZграничность. О новом альбоме «Бордерлайн»

Земфира вернулась после восьмилетнего молчания

СНОБ
Конфеты не виноваты: 5 факторов, которые приближают тебя к диабету Конфеты не виноваты: 5 факторов, которые приближают тебя к диабету

Почему возникает диабет 2-го типа?

Cosmopolitan
Хоть потоп! Хоть потоп!

Что делать, если твою квартиру залили соседи?

Лиза
Неизвестная переменная: Большой адронный коллайдер обнаружил аномальное поведение частиц Неизвестная переменная: Большой адронный коллайдер обнаружил аномальное поведение частиц

О чем говорит странное поведение «прекрасных кварков»?

Популярная механика
Физики подтвердили существование оддерона Физики подтвердили существование оддерона

Физики доказали важное следствие квантовой хромодинамики

N+1
Гельмут, где ты был? История эсэсовца, которого до сих пор преследуют в Канаде и России Гельмут, где ты был? История эсэсовца, которого до сих пор преследуют в Канаде и России

О бывшем эсэсовце и о том, как расследуют преступления, совершенные очень давно

СНОБ
Охранники, дроны и обман папарацци: сколько стоит безопасность принца Гарри и Меган Маркл Охранники, дроны и обман папарацци: сколько стоит безопасность принца Гарри и Меган Маркл

Ежегодный счет за охрану принца Гарри и Меган Маркл может достигать $2-3 млн

Forbes
Традиционная семья: ловушка, в которую тебя хотят заманить Традиционная семья: ловушка, в которую тебя хотят заманить

Тебя привлекают традиционные ценности? Хочется выйти замуж и стать домохозяйкой?

Cosmopolitan
Почему нас достали москвичи. Ответ провинциалки Почему нас достали москвичи. Ответ провинциалки

Чем всех раздражают москвичи?

Cosmopolitan
5 способов освободить память смартфона 5 способов освободить память смартфона

Топ-5 способов освободить память в смартфоне и удалить ненужные данные

Популярная механика
Искусство сборки Искусство сборки

Новая креативная контркультура в мире кастом-байков

Robb Report
«Нельзя было надевать джинсы»: что нам запрещали делать мужчины «Нельзя было надевать джинсы»: что нам запрещали делать мужчины

Читательницы рассказали о странных требованиях, которые им выдвигали партнеры

Psychologies
Бактерии в офисе: где их больше всего? Бактерии в офисе: где их больше всего?

Разбираемся, где именно собирается больше всего бактерий в типичном офисе

CHIP
6 техник, которые помогут сказать настоящее «да» 6 техник, которые помогут сказать настоящее «да»

Упражнения, которые помогут нам научиться говорить «да» искренне и уверенно

Psychologies
Союз нерушимый Союз нерушимый

Семейные союзы в дизайне, архитектуре и искусстве

AD
5 маяков России 5 маяков России

В разных уголках России возвышаются маяки, береговые или плавучие

Культура.РФ
Открыть в приложении