Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Четвертая промышленная революция Четвертая промышленная революция

Новая трансформация технологии и промышленности

kiozk originals
Звездное влияние: сколько Jay-Z и другие звезды заработали на сделках с крупным бизнесом Звездное влияние: сколько Jay-Z и другие звезды заработали на сделках с крупным бизнесом

Звезды, которые продавали доли в своих компаниях корпоративным гигантам

Forbes
Древних индейцев Атакамы уличили в покупке и содержании попугаев из Амазонии Древних индейцев Атакамы уличили в покупке и содержании попугаев из Амазонии

Древние индейцы Атакамы держали ара, амазонов и аратинг

N+1
Право на восхождение Право на восхождение

Рождаемся мы личностью или становимся?

Psychologies
Охранники, дроны и обман папарацци: сколько стоит безопасность принца Гарри и Меган Маркл Охранники, дроны и обман папарацци: сколько стоит безопасность принца Гарри и Меган Маркл

Ежегодный счет за охрану принца Гарри и Меган Маркл может достигать $2-3 млн

Forbes
Как я нашла кучу фриков и встретила любовь в Tinder Как я нашла кучу фриков и встретила любовь в Tinder

Где в наши дни искать любовь? Конечно, в Сети

Psychologies
Топ-10 важных витаминов и минералов Топ-10 важных витаминов и минералов

Эти полезные вещества нам необходимы в первую очередь

Лиза
Бунты, восстания, войны и секс-скандалы. Что пережила корона и почему британцы не перестанут петь “Боже, храни королеву” Бунты, восстания, войны и секс-скандалы. Что пережила корона и почему британцы не перестанут петь “Боже, храни королеву”

Какие кризисы пережила британская монархия в своей истории?

Esquire
Продукты, которые не едят диетологи Продукты, которые не едят диетологи

Что не едят специалисты по здоровому питанию и почему?

Cosmopolitan
Глобальный сдвиг или глубочайший кризис: каким будет 2021 год Глобальный сдвиг или глубочайший кризис: каким будет 2021 год

Список главных трендов года

РБК
Как понять мужчину: инструкция для женщин Как понять мужчину: инструкция для женщин

Психолог Александр Шахов учит понимать мужскую логику

Psychologies
Биологи создали карту будущих открытий новых видов позвоночных Биологи создали карту будущих открытий новых видов позвоночных

Больше всего неописанных видов оказалось среди рептилий тропических лесов

N+1
«Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие «Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие

Знаменитые артистки смогли стать мамами вопреки прогнозам врачей

Cosmopolitan
Неземная красота Неземная красота

Как космические технологии меняют индустрию красоты

Cosmopolitan
Сломанная шея и порез артерии: жуткие трагедии на спортивных соревнованиях Сломанная шея и порез артерии: жуткие трагедии на спортивных соревнованиях

Трагедии, которые случились с этими спортсменами, по-настоящему шокировали

Cosmopolitan
6 секретов правильной похвалы 6 секретов правильной похвалы

Как хвалить детей правильно и мотивировать на дальнейшие достижения

Psychologies
Выгорание от видеозвонков. 5 стадий принятия и 4 способа с ним справиться Выгорание от видеозвонков. 5 стадий принятия и 4 способа с ним справиться

Как сделать видеосовещания менее стрессовыми и более эффективными?

Inc.
«Российский хадж. Империя и паломничество в Мекку» «Российский хадж. Империя и паломничество в Мекку»

Отрывок из книги Айлина Кейна об инфраструктуре хаджа в Российской империи

N+1
С плеча и по плечу С плеча и по плечу

Как перепродажа вещей стала называться модным словом «ресейл»

Vogue
Как защититься от собаки Как защититься от собаки

Инструкция от нападения собаки

Maxim
История балетного костюма История балетного костюма

Как эволюционировал балетный костюм в России

Культура.РФ
Группа “Винтаж” Группа “Винтаж”

В своем доме Алла Шумейко собрала уникальный ретросостав из винтажной мебели

AD
ANAIS не воспроизвел результаты DAMA/LIBRA по поиску темной материи ANAIS не воспроизвел результаты DAMA/LIBRA по поиску темной материи

Ученым не удалось увидеть следов скоплений темной материи в галактическом гало

N+1
10 фактов, которые считались детскими мифами, оказались чистейшей правдой 10 фактов, которые считались детскими мифами, оказались чистейшей правдой

Детей находят в капусте, а быть водителем троллейбуса — круто

Maxim
Каланы защитили от морских ежей остатки калифорнийских водорослевых лесов Каланы защитили от морских ежей остатки калифорнийских водорослевых лесов

Возможно, каланы помогут лесам восстановиться на участках, где те исчезли

N+1
Новые космические бизнесы: Евгений Кузнецов Новые космические бизнесы: Евгений Кузнецов

«Космические разработки касаются каждого»

Esquire
Вот это мозг: 5 захватывающих книг о нейробиологии Вот это мозг: 5 захватывающих книг о нейробиологии

Подборка бестселлеров о работе самого загадочного органа

Популярная механика
Нейронные герои Нейронные герои

Валерий Шарипов рассказал «Популярной механике» о своих синтетических героях

Популярная механика
Доставай блендер! Фильмы, которые вдохновляют на готовку Доставай блендер! Фильмы, которые вдохновляют на готовку

Кулинарное вдохновение и правда существует! Не верите? Смотрите сами!

Cosmopolitan
Гибель без крови Гибель без крови

Нехватка продовольствия не раз становилась причиной массовой гибели людей

Дилетант
Открыть в приложении