Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как люди в древности определяли точное время и когда в России появился первый часовой механизм? Как люди в древности определяли точное время и когда в России появился первый часовой механизм?

Считается, что первые механические часы на Руси появились в 1404 году

Культура.РФ
«Цифровой след оставляют все» «Цифровой след оставляют все»

Слияние данных из разных источников — технология и настоящего, и будущего

Forbes
Новая BMW 4: три мнения о купе, которое критикуют за ноздри Новая BMW 4: три мнения о купе, которое критикуют за ноздри

Впечатления от самой одиозной BMW последних лет

РБК
Исследование: перевод на руководящие должности самых самостоятельных сотрудников может навредить их карьере и всей компании Исследование: перевод на руководящие должности самых самостоятельных сотрудников может навредить их карьере и всей компании

Какие сотрудники могут потенциально столкнуться с разочарованием от повышения

Inc.
«Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей «Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей

Звезды. которые набрались смелости и сами выступили инициаторами разрыва

Cosmopolitan
Каланы защитили от морских ежей остатки калифорнийских водорослевых лесов Каланы защитили от морских ежей остатки калифорнийских водорослевых лесов

Возможно, каланы помогут лесам восстановиться на участках, где те исчезли

N+1
Интервью с IOWA и премьера клипа Интервью с IOWA и премьера клипа

IOWA о том, почему российская музыкальная сцена прониклась большой поэзией

СНОБ
Мария Евневич Мария Евневич

Совладелица первого «Максидом» ведет экспансию петербургского бренда по России

Собака.ru
Перспективы колонизации мира иного, или Для кого на Марсе будет что-нибудь цвести Перспективы колонизации мира иного, или Для кого на Марсе будет что-нибудь цвести

Зачем людям осваивать Марс?

СНОБ
Нарциссизм и высокая самооценка: в чем разница? Нарциссизм и высокая самооценка: в чем разница?

Как не спутать нарциссизм и уверенность в себе

Psychologies
Миллиардер Денис Свердлов — Forbes: «Со временем наши микрофабрики станут как McDonald's или Starbucks» Миллиардер Денис Свердлов — Forbes: «Со временем наши микрофабрики станут как McDonald's или Starbucks»

Денис Свердлов: почему микрозаводы Arrival станут распространены как McDonald's

Forbes
10 самых опасных предметов твоего гардероба 10 самых опасных предметов твоего гардероба

Список опасных предметов одежды

Cosmopolitan
Бумажный антистресс: шесть книг, которые согреют и успокоят Бумажный антистресс: шесть книг, которые согреют и успокоят

Книги, которые помогут дотянуть до весеннего солнца и ободряющего голубого неба

Seasons of life
Грибы превратят деревянный пол в пьезогенератор Грибы превратят деревянный пол в пьезогенератор

Материаловеды усилили пьезоэлектрический эффект древесины с помощью грибов

N+1
Обиженная коварными мужчинами Анжелика: любовные трагедии Мишель Мерсье Обиженная коварными мужчинами Анжелика: любовные трагедии Мишель Мерсье

Мишель Мерсье вошла в историю кинематографа как одна из самых красивых актрис

Cosmopolitan
Кладбище домашних животных в руинах античного порта указало на заботу о питомцах Кладбище домашних животных в руинах античного порта указало на заботу о питомцах

Жители города ухаживали за больными животными и хоронили умерших питомцев

N+1
Джазист, писатель, актер и патафизик: 24 личности Бориса Виана Джазист, писатель, актер и патафизик: 24 личности Бориса Виана

О жизни, творчестве и мистификациях поэта Бориса Виана

Esquire
Новые космические бизнесы: Юсеф Хесуани Новые космические бизнесы: Юсеф Хесуани

«В космосе ничего поправить в процессе уже нельзя»

Esquire
Топ-10 самых ядовитых животных на нашей планете Топ-10 самых ядовитых животных на нашей планете

Животные, которые могут убивать лишь одним укусом

Популярная механика
«Коммерческий успех беспилотников возможен — надо просто запретить ездить людям» «Коммерческий успех беспилотников возможен — надо просто запретить ездить людям»

Интервью с президентом российской компании StarLine Темуром Аминджановым

VC.RU
С меня хватит С меня хватит

Как научиться выпивать осознанно

GQ
6 вещей, которые нельзя хранить в кошельке 6 вещей, которые нельзя хранить в кошельке

Все они хоть раз побывали в твоем бумажнике. А зря!

Maxim
Бактерии в офисе: где их больше всего? Бактерии в офисе: где их больше всего?

Разбираемся, где именно собирается больше всего бактерий в типичном офисе

CHIP
Будь меркантильной: 9 проявлений его жадности, которые нельзя прощать Будь меркантильной: 9 проявлений его жадности, которые нельзя прощать

Проявления мужской жадности, которые прощать никак нельзя

Cosmopolitan
«Я нанимаю тех, кто в своей области на пять голов меня выше»: карьерные советы президента «2ГИС» «Я нанимаю тех, кто в своей области на пять голов меня выше»: карьерные советы президента «2ГИС»

Президент 2GIS делится бизнес-советами

Forbes
Астероид Лесков Астероид Лесков

В вакуумном безмолвии космической бесконечности движется астероид номер 4741

Наука и жизнь
Как работает округление чисел в Эксель: принципы и настройки Как работает округление чисел в Эксель: принципы и настройки

Чтобы упростить расчеты, можно самостоятельно настроить формат чисел в Excel

CHIP
Кто такой карьерист и как с ним бороться Кто такой карьерист и как с ним бороться

Если офис не дезинфицировать, в нем могут завестись карьеристы!

Maxim
Страдания юных веганов Страдания юных веганов

Хроника мучений первых вегетарианцев в России

Weekend
Питьевой режим при кормлении грудью Питьевой режим при кормлении грудью

Что нужно пить кормящим мамам и в каком количестве?

9 месяцев
Открыть в приложении