Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Важность детства Важность детства

Что дошкольникам по-настоящему нужно от взрослых

kiozk originals
Склады с собственным лицом Склады с собственным лицом

Кастомизация — один из главных трендов рынка складов

Эксперт
Физики подтвердили существование оддерона Физики подтвердили существование оддерона

Физики доказали важное следствие квантовой хромодинамики

N+1
Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей

Clubhouse и забытые стратегии вирусного продвижения

Forbes
Как посмотреть на Солнце в телескоп Как посмотреть на Солнце в телескоп

Как можно посмотреть на Солнце без всякого вреда для здоровья

Популярная механика
Писатель Григорий Служитель — об одиночестве и домашних посиделках Писатель Григорий Служитель — об одиночестве и домашних посиделках

Какое оно, одиночество нашего времени, и что мы можем ему противопоставить

РБК
Создал бизнес с 6000 рублей и без плана: монолог основателя мастерской-производителя звукоснимателей Fokin Pickups Создал бизнес с 6000 рублей и без плана: монолог основателя мастерской-производителя звукоснимателей Fokin Pickups

Илья Фокин уволился из нефтяной компании, чтобы делать звукосниматели для гитар

VC.RU
«Надо перестать стесняться»: предприниматель выставил валенки на Kickstarter, чтобы сделать их популярными за рубежом «Надо перестать стесняться»: предприниматель выставил валенки на Kickstarter, чтобы сделать их популярными за рубежом

На Kickstarter появился проект Voylok, собирающий деньги на валенки

VC.RU
6 простых способов улучшить ваши отношения с подругой, согласно экспертам 6 простых способов улучшить ваши отношения с подругой, согласно экспертам

С помощью этих нехитрых шагов ваша любовь станет еще крепче

Playboy
8 фактов о языке, которые нужно узнать, прежде чем ты сядешь обедать 8 фактов о языке, которые нужно узнать, прежде чем ты сядешь обедать

Представляешь, для некоторых счастливчиков вкус колбасы в десять раз колбаснее!

Maxim
Фотошоп не понадобится! Как добиться «голливудской» кожи за одну процедуру Фотошоп не понадобится! Как добиться «голливудской» кожи за одну процедуру

Что такое лазерная шлифовка кожи и стоит ли она своих денег?

Cosmopolitan
Диета минус 10 кг Диета минус 10 кг

Как похудеть на 10 кг? И возможно ли похудеть быстро?

Cosmopolitan
Второй круг Михалкова. «Сибирский цирюльник» как точка отсчета для новой России Второй круг Михалкова. «Сибирский цирюльник» как точка отсчета для новой России

О символизме «Сибирского цирюльника»

СНОБ
Черная акула оказалась самым крупным светящимся позвоночным Черная акула оказалась самым крупным светящимся позвоночным

Вероятно, она использует биолюминесценцию, чтобы незаметно подкрасться к жертве

N+1
Детство монстров Детство монстров

Как, кто и почему породил Кинг-Конга и Годзиллу

Weekend
Дома никого. Эстетика заброшенных особняков в объективе Томаса Джориона Дома никого. Эстетика заброшенных особняков в объективе Томаса Джориона

Фотограф Томас Джорион превратил свое мальчишеское увлечение в профессию

Seasons of life
Городские неразлучники в жару охладились у вентиляционных отверстий зданий Городские неразлучники в жару охладились у вентиляционных отверстий зданий

Поведенческая адаптация помогает неразлучникам выживать в экстремальном климате

N+1
Внеземная красота: 12 топ-моделей с необычными физическими данными Внеземная красота: 12 топ-моделей с необычными физическими данными

Cтранная и нестандартная красота этих моделей притягивает как магнит

Cosmopolitan
3D-моделирование помогло прочитать древнерусские надписи на стенах собора 3D-моделирование помогло прочитать древнерусские надписи на стенах собора

Ученые смогли восстановить текст древнейшего памятника письменности

Популярная механика
Биологи создали карту будущих открытий новых видов позвоночных Биологи создали карту будущих открытий новых видов позвоночных

Больше всего неописанных видов оказалось среди рептилий тропических лесов

N+1
«Многосерийный убийца кинематографа»: почему сериал «Чикатило» — пугающий прецедент «Многосерийный убийца кинематографа»: почему сериал «Чикатило» — пугающий прецедент

«Чикатило» — ужасное кино и пугающий прецедент для всего стримингового рынка

Forbes
Лампочка, зажгись! Лампочка, зажгись!

Свежие идеи и нестандартные решения – залог успеха. Но где их взять?

Лиза
Художник Николай Кошелев: «Мне очень нравится жить в окружении своих работ» Художник Николай Кошелев: «Мне очень нравится жить в окружении своих работ»

Николай Кошелев — о своих работах и локдауне в Москве

GQ
Как перестать заикаться: секреты, помогающие стать увереннее в разговоре с девушками и не только Как перестать заикаться: секреты, помогающие стать увереннее в разговоре с девушками и не только

Определение и причины заикания, а также как с ним бороться

Playboy
«Золотой глобус» — 2021: кто победил и нужна ли вообще эта премия «Золотой глобус» — 2021: кто победил и нужна ли вообще эта премия

Почему миру, по сути, больше не нужен «Золотой глобус»?

Forbes
Плачь, детка, плачь Плачь, детка, плачь

В чем причина того, что мы плачем часто или не плачем вовсе?

Лиза
«Валериан»: как Люк Бессон шел к главному фильму всей своей жизни «Валериан»: как Люк Бессон шел к главному фильму всей своей жизни

Из чего состоит мультивселенная самого амбициозного режиссера Европы

Esquire
Роман Должанский: Одоевское трехлучье Роман Должанский: Одоевское трехлучье

Новые главы из будущей книги Романа Должанского о путешествиях по России

СНОБ
Когда не хватает витаминов Когда не хватает витаминов

В начале весны важно включать в свой рацион продукты, богатые витаминами

Здоровье
Е-коммерческий банк Е-коммерческий банк

Лев Хасис строит партнерства ради торговых и платежных сервисов «Сбера»

Forbes
Открыть в приложении