Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

В защиту эгоизма В защиту эгоизма

Почему не стоит жертвовать собой ради других

kiozk originals
Мой ребенок растет билингвом — радоваться или опасаться? Мой ребенок растет билингвом — радоваться или опасаться?

В билингвизме нет ничего странного и страшного

СНОБ
12 фактов о Тине Тернер 12 фактов о Тине Тернер

История великой Тины Тернер

Maxim
Знойные красотки: как выглядят жены солистов легендарной группы Modern Talking Знойные красотки: как выглядят жены солистов легендарной группы Modern Talking

Как сложилась личная жизнь солистов группы Modern Talking

Cosmopolitan
«Это что, заболевание, требующее лечения?» Узнали у депутата от «Единой России», зачем нужно запрещать аборты в частных клиниках «Это что, заболевание, требующее лечения?» Узнали у депутата от «Единой России», зачем нужно запрещать аборты в частных клиниках

Депутат Владимир Крупенников — о запрете абортов в России

СНОБ
Настоящая леди Настоящая леди

Келли Хоппен создаёт элегантные интерьеры, которым не страшны года

SALON-Interior
Микродозы психоделиков и плацебо одинаково повлияли на психическое и когнитивное состояние людей Микродозы психоделиков и плацебо одинаково повлияли на психическое и когнитивное состояние людей

Субъективное улучшение - это эффект плацебо, а не результат действия препарата

N+1
«Мы изранены!»: Меган Маркл, Наоми Кэмпбелл и другие звезды, пережившие расизм «Мы изранены!»: Меган Маркл, Наоми Кэмпбелл и другие звезды, пережившие расизм

В нашем многогранном мире до сих пор встречаются случаи нетерпимости

Cosmopolitan
Каршеринг заблокировал мою машину. Что делать? Каршеринг заблокировал мою машину. Что делать?

Куда звонить и от кого ждать помощи, если каршеринг перекрыл дорогу

РБК
Как Бриджет Джонс обвалила продажи шардоне и еще 12 забавных историй о фильме Как Бриджет Джонс обвалила продажи шардоне и еще 12 забавных историй о фильме

Неожиданные факты о первом фильме про приключения Бриджет Джонс

Cosmopolitan
Больше, чем поэт Больше, чем поэт

Как русская девочка стала английским поэтом-миллионером

Tatler
10 главных вопросов о посудомоечных машинах: отвечает производитель 10 главных вопросов о посудомоечных машинах: отвечает производитель

Отвечаем на самые популярные вопросы о посудомоечных машинах

CHIP
Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности

В чем секрет Илона Маска, может ли такой режим отдыха подойти обычному человеку

РБК
Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров

Экзопланета, находящаяся всего в 26 световых годах от нас

Популярная механика
Вместе до гробовой доски: история любви Майи Плисецкой и Родиона Щедрина Вместе до гробовой доски: история любви Майи Плисецкой и Родиона Щедрина

Долгая и красивая история любви Майи Плисецкой и Родиона Щедрина

Cosmopolitan
Миллиардер Денис Свердлов — Forbes: «Со временем наши микрофабрики станут как McDonald's или Starbucks» Миллиардер Денис Свердлов — Forbes: «Со временем наши микрофабрики станут как McDonald's или Starbucks»

Денис Свердлов: почему микрозаводы Arrival станут распространены как McDonald's

Forbes
Прощай, второй подбородок и носогубные складки! Экономим на уколах и подтяжке Прощай, второй подбородок и носогубные складки! Экономим на уколах и подтяжке

Что такое миофасциальный массаж лица и чем он полезен?

Cosmopolitan
Самые загадочные явления планеты Самые загадочные явления планеты

Наши предки называли это «чертовщиной», а ученые относят к области непознанного

Maxim
Отрывок из книги Киры Ярмыш, презентацию которой исключили из программы ярмарки Non/fiction Отрывок из книги Киры Ярмыш, презентацию которой исключили из программы ярмарки Non/fiction

Фрагмент из книги Киры Ярмыш «Невероятные происшествия в женской камере №3»

СНОБ
10 самых опасных хобби в мире 10 самых опасных хобби в мире

Самые рискованные виды хобби, которые уносят десятки жизней каждый год

Популярная механика
Стефано Канали, генеральный директор Canali Стефано Канали, генеральный директор Canali

Как мягкость и комфорт стали главными словами в моде

Esquire
Правила жизни Габриэля Гарсиа Маркеса Правила жизни Габриэля Гарсиа Маркеса

Правила жизни лауреата Нобелевской премии по литературе Габриэля Гарсиа Маркеса

Esquire
Netflix, Spotify и публичные выступления: сколько стоят принц Гарри и Меган Маркл Netflix, Spotify и публичные выступления: сколько стоят принц Гарри и Меган Маркл

Как и из чего складывается доход принца Гарри и Меган Маркл

Forbes
10 модных ошибок, которые ты не должна совершать после 20 лет 10 модных ошибок, которые ты не должна совершать после 20 лет

Детали гардероба, от которых необходимо избавиться все девушкам старше 20 лет

Cosmopolitan
Простой способ понять, склонны ли вы к ипохондрии Простой способ понять, склонны ли вы к ипохондрии

Эксперт — о том, как понять, что у вас развивается ипохондрия, и как с этим быть

Psychologies
Сделано на пять Сделано на пять

Фотограф Сергей Ананьев показал AD свою новую четырехкомнатную квартиру

AD
Продукты, которые не едят диетологи Продукты, которые не едят диетологи

Что не едят специалисты по здоровому питанию и почему?

Cosmopolitan
Хоть потоп! Хоть потоп!

Что делать, если твою квартиру залили соседи?

Лиза
Похудеть на 20 кг и держать вес уже 15 лет: реальная история нашей читательницы Похудеть на 20 кг и держать вес уже 15 лет: реальная история нашей читательницы

Наша героиня сумела справиться с собой и достигла потрясающих результатов!

Cosmopolitan
Мария Евневич Мария Евневич

Совладелица первого «Максидом» ведет экспансию петербургского бренда по России

Собака.ru
Открыть в приложении