Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Слушай, вдохновляй, мири: 50 оттенков эмоционального обслуживания Слушай, вдохновляй, мири: 50 оттенков эмоционального обслуживания

Что такое эмоциональное обслуживание, почему его требуют чаще от женщин

Cosmopolitan
Похороны по-большевистски Похороны по-большевистски

Личный архив, коллекция, музей-квартира, реконструкция…

Дилетант
Под впечатлением Под впечатлением

Дерзкий индустриальный интерьер с аллюзиями на барокко

SALON-Interior
Новая искренность: почему заявление Байдена спровоцирует ковровую «бомбардировку Воронежа» Новая искренность: почему заявление Байдена спровоцирует ковровую «бомбардировку Воронежа»

Яростная борьба с мифическим западным влиянием станет главным оружием власти

Forbes
Быстрый и богатый Быстрый и богатый

Этот человек сделал одну из самых головокружительных карьер ХХ века

Maxim
Что вам нужно знать о Вилли Чаваррии – новом главном дизайнере мужской линии Calvin Klein Что вам нужно знать о Вилли Чаваррии – новом главном дизайнере мужской линии Calvin Klein

Вилли Чаваррия — король объемных силуэтов, борец с гомофобией и расизмом

GQ
Одна вокруг света: от тропических лесов до лавандовой столицы Северной Америки Одна вокруг света: от тропических лесов до лавандовой столицы Северной Америки

110 серия о кругосветном путешествии москвички Ирины Сидоренко и ее собаки Греты

Forbes
Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами» Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами»

Похищение, насилие, годы, проведенные в бункере всего в 90 километрах от дома

Psychologies
Как скрыть друзей в ВК от других пользователей Как скрыть друзей в ВК от других пользователей

Как скрыть друзей в ВК через компьютер или смартфон на Android или iOS

CHIP
Фастфуд и долгий сон: 5 привычек, которые доведут тебя до слепоты Фастфуд и долгий сон: 5 привычек, которые доведут тебя до слепоты

Признайся, не хотелось бы проснуться в день и обнаружить, что зрение ухудшилось

Cosmopolitan
Почему беседу стоит прерывать раньше, чем мы привыкли: мнение ученых Почему беседу стоит прерывать раньше, чем мы привыкли: мнение ученых

Большинство участников любой беседы на самом деле хотят, чтобы диалог закончился

Популярная механика
«Как я подозревала у сына аутизм, а получила диагноз сама» «Как я подозревала у сына аутизм, а получила диагноз сама»

К чему может привести стремление найти у ребенка проблему?

Psychologies
«Компании, которые работают „как все“, вымрут». Основатель сервиса «Самокат» Родион Шишков — о будущем фудтеха и главных трендах ретейла «Компании, которые работают „как все“, вымрут». Основатель сервиса «Самокат» Родион Шишков — о будущем фудтеха и главных трендах ретейла

Основатель «Самоката» — о трендах фудтеха и о том, как поспевать за изменениями

Inc.
Специалисты с синдромом самозванца работают лучше, чем уверенные в себе, показало исследование Специалисты с синдромом самозванца работают лучше, чем уверенные в себе, показало исследование

Синдром самозванца никак не влияет на производительность труда специалистов

Inc.
Готовы? Записывайте Готовы? Записывайте

Возьмите ручку и блокнот, откройте его на чистой странице, пишите

Glamour
IceCube увидел следы резонанса Глэшоу IceCube увидел следы резонанса Глэшоу

Это открытие поможет изучить источники астрофизических нейтрино

N+1
Как корабль назовешь Как корабль назовешь

Тихон Жизневский — о том, как стал первым российским супергероем

OK!
Ужаснись! Cамые красивые ведьмы в кино: 11 актрис, идеально вписавшиеся в образ Ужаснись! Cамые красивые ведьмы в кино: 11 актрис, идеально вписавшиеся в образ

Эти актрисы идеально вписались в образы пугающих, но красивых ведьм

Cosmopolitan
Звезда «Студии 54», модель Хельмута Ньютона и королева ювелирного дизайна: что нужно знать об Эльзе Перетти Звезда «Студии 54», модель Хельмута Ньютона и королева ювелирного дизайна: что нужно знать об Эльзе Перетти

Что стоит знать о работе Эльзы Перетти, а также о ее модельной карьере

Esquire
Индийские женщины в знак протеста фотографируются в рваных джинсах Индийские женщины в знак протеста фотографируются в рваных джинсах

Протестная инициатива индийских женщин — флешмоб #RippedJeansTwitter

Psychologies
Правила жизни Александра Вертинского Правила жизни Александра Вертинского

Поэт и певец, умер 21 мая 1957 года в возрасте 68 лет в Ленинграде

Esquire
Посмотри с бойфрендом: самые красивые  и чувственные эротические фильмы Посмотри с бойфрендом: самые красивые  и чувственные эротические фильмы

Что посмотреть вдвоем, чтобы настроиться на нужную волну и незабываемый вечер?

Cosmopolitan
«Твиттер» обсуждает ужасные вещи, которые почему-то всем нравятся «Твиттер» обсуждает ужасные вещи, которые почему-то всем нравятся

Стыдные вещи, которые тем не менее всем нравятся

Maxim
Бумажный антистресс: шесть книг, которые согреют и успокоят Бумажный антистресс: шесть книг, которые согреют и успокоят

Книги, которые помогут дотянуть до весеннего солнца и ободряющего голубого неба

Seasons of life
«Я не такая»: каким женщинам и почему не нужен феминизм «Я не такая»: каким женщинам и почему не нужен феминизм

Почему женщины поддерживают патриархальные ценности?

Psychologies
Обряды плацебо: сила пустышки Обряды плацебо: сила пустышки

Никто не знает, как оно действует, но им все пользуются

Популярная механика
Валерия Брусникина: «Блокчейн увеличивает прозрачность и надежность сделок» Валерия Брусникина: «Блокчейн увеличивает прозрачность и надежность сделок»

Возможности и перспективы блокчейна

Forbes
Из Китая с ужасом. Легизм — самая честная и жуткая тоталитарная доктрина в мире Из Китая с ужасом. Легизм — самая честная и жуткая тоталитарная доктрина в мире

Лучше бы древние китайцы ограничились шелком, фарфором и порохом

Maxim
Дойти до вершины: как первая советская альпинистка Эльвира Шатаева отстояла право покорять горы без мужчин Дойти до вершины: как первая советская альпинистка Эльвира Шатаева отстояла право покорять горы без мужчин

Как Шатаева завоевывала горы и право подниматься на них для женщин

Forbes
Розовый цвет — миллениалам, желтый — зумерам: как бренды продают эстетику поколений Розовый цвет — миллениалам, желтый — зумерам: как бренды продают эстетику поколений

Почему маркетинг-стратегия эстетики поколений не сработала

Forbes
Открыть в приложении