Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Первый рейтинг self-made женщин России возглавила основательница Wildberries Татьяна Бакальчук Первый рейтинг self-made женщин России возглавила основательница Wildberries Татьяна Бакальчук

Татьяна Бакальчук стала самой состоятельной self-made женщиной России

Forbes
Брильянты, балы и браки по расчету: британские сериалы про высшее общество Брильянты, балы и браки по расчету: британские сериалы про высшее общество

Британские сериалы о высшем свете

Cosmopolitan
В шаге от неизвестности В шаге от неизвестности

Встречи с дикими представителями живой природы в лесах Беларуси

Наука и жизнь
В чем секрет обаяния? В чем секрет обаяния?

Что же такое обаяние? И как им обзавестись?

Esquire
10 самых дорогих фотографий в истории 10 самых дорогих фотографий в истории

Фото на любой кошелек! От миллиона до четырех миллионов долларов!

Maxim
«Мы не увидели маньяка»: что не так с фильмом Ксении Собчак о Викторе Мохове «Мы не увидели маньяка»: что не так с фильмом Ксении Собчак о Викторе Мохове

Разрешать ли преступникам выступать на публике?

Psychologies
8 мифов о радужном материнстве, или О чем не рассказывают будущим мамам 8 мифов о радужном материнстве, или О чем не рассказывают будущим мамам

Мифы о материнстве, которые не отражают реальность

9 месяцев
11 упражнений с резинкой: описания, видео и инструкции 11 упражнений с резинкой: описания, видео и инструкции

Лента-эспандер поможет расширить комплекс домашних упражнений

РБК
Отражение в глазах выдало в фотографиях людей дипфейки Отражение в глазах выдало в фотографиях людей дипфейки

Исследователи обнаружили новый метод отличать дипфейк от реальности

N+1
Как сделать онлайн-обучение эффективным Как сделать онлайн-обучение эффективным

Что поможет сделать онлайн-образование более результативным?

СНОБ
Ген жирафа защитил мышей от гипертонии и сделал их кости прочнее Ген жирафа защитил мышей от гипертонии и сделал их кости прочнее

Биологи выявили гены, которые позволяют жирафам решать физиологические проблемы

N+1
Втягивание глаз и стягивание кожи вокруг них помогло рыбам фугу моргнуть Втягивание глаз и стягивание кожи вокруг них помогло рыбам фугу моргнуть

Ранее механизм закрывания глаз у рыб фугу был неизвестен

N+1
Продавец, политик, тамада: кем работают участники шоу «Каникулы в Мексике» Продавец, политик, тамада: кем работают участники шоу «Каникулы в Мексике»

Реалити-шоу «Каникулы в Мексике» оставило яркий след в сердцах поклонников

Cosmopolitan
«Я не видела паспорта и ключей с тех пор, как стала членом семьи»: главное из интервью Опры с Меган Маркл и принцем Гарри «Я не видела паспорта и ключей с тех пор, как стала членом семьи»: главное из интервью Опры с Меган Маркл и принцем Гарри

Хайлайты из интервью принца Гарри и Меган Маркл, которого ждал весь мир

Forbes
5 историй из жизни Галины Улановой 5 историй из жизни Галины Улановой

Истории из жизни Галины Улановой, свидетелями которых были личные вещи балерины

Культура.РФ
Источник силы Источник силы

Иногда случаются ситуации, когда все настолько скверно, что не знаешь, как быть

Лиза
Не царский сын? Не царский сын?

Рождение Павла Петровича вызвало много пересудов при дворе

Дилетант
Почему смартфоны разряжаются на морозе, и что с этим делать Почему смартфоны разряжаются на морозе, и что с этим делать

Почему смартфоны могут перестать работать при минусовых температурах?

Популярная механика
Офис в мотеле и деньги других людей: как Марк Рэндольф создавал Netflix Офис в мотеле и деньги других людей: как Марк Рэндольф создавал Netflix

Отрывок из книги «That will never work» об истории создания Netflix

Forbes
«Пришел марток»: приметы и традиции первого месяца весны «Пришел марток»: приметы и традиции первого месяца весны

Мороз и первое тепло, масленичное разгулье и строгий Великий пост

Psychologies
5 шагов к идеальной фигуре: тренер Анджелины Джоли раскрывает секреты 5 шагов к идеальной фигуре: тренер Анджелины Джоли раскрывает секреты

Всего 25 минут в день — и через месяц ты сможешь носить меньший размер одежды!

Cosmopolitan
Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино

Посмотрим на родственниц Мелани Гриффит, Шэрон Стоун и других знаменитостей

Cosmopolitan
Снежана Самохина сыграет сексуальную волейболистку в сериале «Дылды» на СТС Снежана Самохина сыграет сексуальную волейболистку в сериале «Дылды» на СТС

Интервью с Снежаной Самохиной

Cosmopolitan
3 практики для борьбы с негативом 3 практики для борьбы с негативом

Практики осознанности поддерживают нас, когда тревога не дает дышать

Psychologies
Джим-тоник Джим-тоник

Многогранность Джима Керри притягивает

Playboy
Начало родов: важные советы тем, кто рожает первый раз Начало родов: важные советы тем, кто рожает первый раз

Что делать, если начались роды

9 месяцев
Кодекс Вселенной Кодекс Вселенной

Какие земные или внеземные законы должны действовать за пределами нашей планеты?

Вокруг света
Как эмиратские женщины запускают спутники и готовятся лететь в космос Как эмиратские женщины запускают спутники и готовятся лететь в космос

Зачем Арабским Эмиратам космическая программа и какую роль в ней играют женщины

Forbes
Импорт биотического опыления связали с утратой биоразнообразия Импорт биотического опыления связали с утратой биоразнообразия

Бразильские ученые предложили концепцию виртуального опыления

N+1
15 знаменитых фильмов, запрещенных в самых неожиданных странах 15 знаменитых фильмов, запрещенных в самых неожиданных странах

Китайцам чем-то не угодил фильм «Назад в будущее»

Maxim
Открыть в приложении