Почему извлечь пользу из big data получается не у всех?

РБКБизнес

Принять как данные

Автор: Оксана Гончарова

0:00 /
1029.799
Фото: ТАСС

Евгений и Татьяна вернут кредит с большей вероятностью, чем Ипполит и Барбара. Выйдя из отпуска, рабочие вдвое чаще подвергают себя риску производственной травмы… Анализируя большие данные, компании учатся выявлять подобные скрытые закономерности, улучшая свои бизнес-показатели. Направление модное, но извлечь пользу из big data получается не у всех. Причина — отсутствие в компаниях культуры работы с ними.

«Чем более распространенное имя у человека, тем выше шанс, что он заплатит вовремя. Чем больше этажей в твоем доме, тем статистически ты более хороший заемщик. Знак зодиака почти не влияет на вероятность возврата денег, а вот психотип — значительно», — рассказывает о неожиданных закономерностях в поведении заемщиков аналитик Банка Хоум Кредит Станислав Дужинский. Объяснить многие из этих закономерностей он не берется — их выявил искусственный интеллект, обработавший тысячи профилей клиентов.

В этом сила аналитики big data: проанализировав огромный объем неструктурированных данных, программа может обнаружить множество корреляций, о которых самый мудрый аналитик-человек даже не догадывается. У любой компании есть огромное количество неструктурированных данных (big data) — о сотрудниках, клиентах, партнерах, конкурентах, которые можно использовать с пользой для бизнеса: улучшить эффект от рекламных акций, добиться роста продаж, снизить кадровую текучку и т.п.

Первыми работать с big data начали крупные технологические и телекоммуникационные компании, финансовые организации и ретейл, комментирует Рафаил Мифтахов, директор группы технологической интеграции «Делойт», СНГ. Сейчас интерес к таким решениям есть во многих отраслях. Чего удалось добиться компаниям? И всегда ли анализ больших данных позволяет делать ценные выводы?

Нелегкий груз

Банки используют алгоритмы обработки больших данных прежде всего для улучшения качества обслуживания клиентов и оптимизации затрат, а также для управления рисками и борьбы с мошенничеством. «За последние годы в сфере анализа big data произошла настоящая революция, — говорит Дужинский. — Применение машинного обучения позволяет нам намного более точно прогнозировать вероятность невозврата кредита — просрочки в нашем банке составляют всего 3,9%». Для сравнения, на 1 января 2019 года доля ссуд с просроченными платежами свыше 90 дней по кредитам, выдаваемым физлицам, составила, по данным ЦБ, 5%.

Изучением больших данных озадачились даже микрофинансовые организации. «Предоставлять финансовые услуги без анализа больших данных сегодня все равно, что заниматься математикой без цифр, — рассуждает Андрей Пономарев, гендиректор платформы интернет-кредитования Webbankir. — Мы выдаем деньги онлайн, не видя ни самого клиента, ни его паспорта, и в отличие от традиционного кредитования должны не только оценить платежеспособность человека, но и идентифицировать его личность».

Сейчас в базе компании хранится информация по более чем 500 тыс. клиентов. Каждая новая заявка анализируется с учетом этих данных примерно по 800 параметрам. Программа учитывает не только пол, возраст, семейное положение и кредитную историю, но и то, с какого устройства человек заходил на платформу, как вел себя на сайте. Насторожить, например, может то, что потенциальный заемщик не воспользовался кредитным калькулятором или не поинтересовался условиями выдачи займа. «За исключением нескольких стоп-факторов — скажем, мы не выдаем займы лицам моложе 19 лет — ни один из перечисленных параметров сам по себе не является поводом для отказа или согласия в выдаче займа», — поясняет Пономарев. Важна именно совокупность факторов. В 95% случаев решение принимается автоматически, без участия специалистов отдела андеррайтинга.

Анализ big data позволяет выводить интересные закономерности, делится Пономарев. Например, пользователи iPhone оказались более дисциплинированными заемщиками, чем владельцы устройств на базе Android — первые получают одобрение заявок в 1,7 раза чаще. «То, что военнослужащие не возвращают кредиты почти на четверть реже, чем средний заемщик, не было неожиданностью, — говорит Пономарев. — А вот от студентов обязательности обычно не ожидают, а между тем случаи кредитных дефолтов у них встречаются на 10% реже, чем в среднем по базе».

Изучение больших данных позволяет проводить скоринг и для страховщиков. Работающая с 2016 года компания IDX занимается удаленной идентификацией личности и онлайн-проверкой документов. Эти услуги востребованы среди страховщиков грузоперевозок, которые заинтересованы, чтобы грузы пропадали как можно реже. Прежде чем застраховать перевозку товара, страховщик с согласия водителя проверяет его на благонадежность, поясняет Ян Слока, коммерческий директор IDX. Вместе с партнером — петербургской компанией «Контроль рисков» — IDX разработала сервис, который позволяет проверить личность водителя, паспортные данные и права, участие в инцидентах, связанных с утратой груза, и т.п. Проведя анализ базы водителей, компания выявила «группу риска»: чаще всего грузы пропадают у водителей 30–40 лет с большим водительским стажем, часто менявших в последнее время работу. Выяснилось также, что груз чаще всего воруют водители автомобилей, срок эксплуатации которых превышает восемь лет.

В поиске

У ретейлеров задача иная — вычислить клиентов, готовых совершить покупку, и определить наиболее эффективные способы привести их на сайт или в магазин. С этой целью программы анализируют профиль клиентов, данные из их личного кабинета, историю покупок, поисковых запросов и использования бонусных баллов, содержимое электронных корзин, которые они было начали заполнять, да бросили. Аналитика данных позволяет сегментировать всю базу и выделять группы потенциальных покупателей, которым может оказаться интересным то или иное предложение, говорит Кирилл Иванов, директор data-офиса группы «М.Видео-Эльдорадо».

Например, программа выделяет группы клиентов, каждой из которых нравятся разные маркетинговые инструменты — беспроцентный кредит, кешбэк или скидочный промокод. Эти покупатели получают email-рассылку с соответствующей акцией. Вероятность того, что человек, открыв письмо, перейдет на сайт компании, в этом случае значительно увеличивается, отмечает Иванов.

Анализ данных позволяет также повышать продажи сопутствующих товаров и аксессуаров. Система, обработавшая историю заказов других клиентов, выдает покупателю рекомендации, что можно купить вместе с выбранным товаром. Тестирование такого метода работы, по словам Иванова, показало увеличение количества заказов с аксессуарами на 12% и рост оборота аксессуаров на 15%.

Улучшить качество сервиса и повысить продажи стремятся не только ретейлеры. Летом прошлого года «МегаФон» запустил «умный» сервис предложений, в основу которого легла обработка данных миллионов абонентов. Изучив их поведение, искусственный интеллект научился формировать внутри тарифов персональные предложения для каждого клиента. Например, если программа отмечает, что человек активно смотрит на своем устройстве видео, сервис предложит ему расширить объем мобильного трафика. Учитывая предпочтения пользователей, компания предоставляет абонентам безлимитный трафик на их любимые виды интернет-досуга — например, на использование мессенджеров или прослушивание музыки в стриминговых сервисах, на общение в соцсетях или просмотр сериалов.

«Мы анализируем поведение абонентов и понимаем, как меняются их интересы, — объясняет Виталий Щербаков, директор по аналитике больших данных «МегаФона». — Например, в этом году трафик AliExpress вырос в 1,5 раза по сравнению с прошлым годом, и в целом количество заходов на сайты интернет-магазинов одежды растет: в 1,2–2 раза в зависимости от конкретного ресурса».

Другой пример работы оператора с большими данными — платформа для поиска пропавших детей и взрослых «МегаФон Поиск». Система анализирует, какие люди могли находиться рядом с местом пропажи человека, и рассылает им информацию с фотографией и приметами пропавшего. Оператор разрабатывал и тестировал систему совместно с МВД и организацией «Лиза Алерт»: в течение двух минут ориентировки на пропавшего получают более 2 тыс. абонентов, что значительно увеличивает шансы на удачный результат поиска.

Не ходите в ПАБ

Анализ больших данных нашел применение и в промышленности. Здесь он позволяет прогнозировать спрос и планировать продажи. Так, в группе компаний «Черкизово» три года назад внедрили решение на базе SAP BW, которое позволяет хранить и обрабатывать всю информацию по продажам: цены, ассортимент, объемы продукции, акции, каналы сбыта, рассказывает Владислав Беляев, директор по информационным технологиям группы «Черкизово». Анализ накопленных 2 Тб информации не только дал возможность эффективно формировать ассортимент и оптимизировать продуктовый портфель, но и облегчил работу сотрудникам. Например, для подготовки ежедневного отчета по продажам потребовался бы день работы множества аналитиков — по два на каждый продуктовый сегмент. Сейчас этот отчет готовит робот, тратя на все сегменты всего 30 минут.

«В промышленности большие данные эффективно работают в связке с интернетом вещей, — утверждает генеральный директор компании Umbrella IT Станислав Мешков. — На основе анализа данных с датчиков, которыми оснащено оборудование, можно выявлять отклонения в его работе и предотвращать поломки, спрогнозировать производительность».

В «Северстали» с помощью big data пытаются решать и довольно нетривиальные задачи — например, снизить показатели травматизма. В 2019 году на мероприятия по улучшению безопасности труда компания выделила около 1,1 млрд руб. В «Северстали» рассчитывают к 2025 году снизить уровень травматизма на 50% (по сравнению с 2017 годом). «Если линейный руководитель — мастер, начальник участка, начальник цеха — заметил, что работник выполняет те или иные операции небезопасно (не держится за поручни при подъеме по лестнице на промплощадке или не носит все средства индивидуальной защиты), он выписывает ему особое замечание — ПАБ (от «поведенческий аудит безопасности»)», — рассказывает Борис Воскресенский, начальник отдела анализа данных компании.

Проведя анализ данных о количестве ПАБов в одном из подразделений, специалисты компании выявили, что правила техники безопасности чаще всего нарушались теми, кто уже имел несколько замечаний раньше, а также теми, кто незадолго до инцидента находился на больничном или в отпуске. Нарушения в первую неделю после выхода из отпуска или с больничного оказались вдвое выше, чем в последующее время: 1 против 0,55%. А вот работа в ночную смену, как выяснилось, не влияет на статистику ПАБов.

В отрыве от реальности

Создать алгоритмы обработки больших данных — не самая трудная часть работы, отмечают представители компаний. Гораздо сложнее понять, как эти технологии можно применить в контексте каждого конкретного бизнеса. Именно здесь кроется ахиллесова пята аналитиков компаний и даже внешних провайдеров, которые, казалось бы, имеют наработанную экспертизу в области big data.

«Я часто встречал специалистов по анализу больших данных, которые были прекрасными математиками, но не обладали необходимым пониманием бизнес-процессов», — рассказывает Cергей Котик, директор по развитию компании GoodsForecast. Он вспоминает, как два года назад его компании довелось участвовать в конкурсе по прогнозированию спроса для одной федеральной розничной сети. Был выбран пилотный регион, по всем товарам и магазинам которого участники строили прогнозы. Затем прогнозы сравнивались с фактическими продажами. Первое место занял один из российских интернет-гигантов, известный своей экспертизой в машинном обучении и анализе данных: в своих прогнозах он показал минимальное отклонение от фактических продаж.

Но когда сеть стала изучать его прогнозы детальнее, выяснилось, что с точки зрения бизнеса они абсолютно неприемлемы. Компания представила модель, которая выдавала планы продаж с систематическим занижением. Программа поняла, как минимизировать вероятность ошибки в прогнозах: безопаснее занижать продажи, поскольку максимальная ошибка может составить 100% (отрицательных продаж не бывает), а вот в сторону перепрогноза она может быть сколь угодно большой, поясняет Котик. Другими словами, компания представила идеальную математическую модель, которая в реальных условиях привела бы к полупустым магазинам и огромным убыткам от недопродаж. В результате в конкурсе победила другая компания, чьи расчеты можно было применить на практике.

«Авось» вместо big data

Технологии больших данных актуальны для многих отраслей, но активное их внедрение происходит не везде, замечает Мешков. Например, в здравоохранении есть проблема с хранением данных: информации накоплено много и она регулярно обновляется, но по большей части эти данные еще не оцифрованы. Есть также много данных в госструктурах, но они не объединены в общий кластер. Разработка единой информационной платформы Национальной системы управления данными (НСУД) как раз направлена на то, чтобы решить эту задачу, говорит эксперт.

Впрочем, Россия — далеко не единственная страна, где в большинстве организаций важные решения принимаются на основе интуиции, а не анализа больших данных. В апреле прошлого года компания «Делойт» провела опрос среди более чем тысячи руководителей крупных американских компаний (со штатом от 500 человек) и выяснила, что 63% опрошенных знакомы с технологиями big data, но не имеют всей необходимой инфраструктуры, чтобы их применять. Между тем среди 37% компаний с высоким уровнем аналитической зрелости почти половина значительно превысили бизнес-цели за последние 12 месяцев.

Исследование выявило, что помимо сложности внедрения новых технических решений важной проблемой в компаниях является отсутствие культуры работы с данными. Не стоит ждать хороших результатов, если ответственность за решения, принятые на основе big data, будет возлагаться только на аналитиков компании, а не на всю компанию в целом. «Сейчас компании ищут интересные сценарии использования больших данных, — говорит Мифтахов. — При этом внедрение некоторых сценариев требует инвестиций в системы сбора, обработки и контроля качества дополнительных данных, которые ранее не анализировались». Увы, «аналитика — пока еще не командный вид спорта», — признают авторы исследования.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Восточного» коварство «Восточного» коварство

Как американский бизнесмен Майкл Калви оказался за решеткой

Forbes
Чемпион из Калифорнии: как сеть Erewhon научилась работать вчетверо эффективнее всей розницы США Чемпион из Калифорнии: как сеть Erewhon научилась работать вчетверо эффективнее всей розницы США

Что помогло Erewhon в десять раз нарастить выручку с 2011 года?

Forbes
Системный администратор Системный администратор

Почему айтишники считают премьера Михаила Мишустина главным CIO страны

Forbes
Молоко: pro et contra Молоко: pro et contra

Всё чаще приходится слышать, что для взрослых молоко – продукт вредный

Худеем правильно
На грани слышимости: нейтринные коммуникации для подводного флота На грани слышимости: нейтринные коммуникации для подводного флота

Современные субмарины становятся неслышимы и невидимы для радаров

Популярная механика
Вытащи из продуктов всё полезное Вытащи из продуктов всё полезное

Как готовить овощи и фрукты, чтобы получать из них максимум полезных веществ?

Здоровье
Мифы фондового рынка Мифы фондового рынка

Пять распространенных заблуждений частного инвестора

Forbes
Что не стоит рассказывать друзьям о своих отношениях: 4 запретных темы Что не стоит рассказывать друзьям о своих отношениях: 4 запретных темы

Твоим друзьям и родственникам не нужно знать все о твоей личной жизни

Playboy
Ким Фурнэ: «Люди не хотят переплачивать банкам» Ким Фурнэ: «Люди не хотят переплачивать банкам»

Почему от развития финансовых технологий выиграют прежде всего бедные страны

РБК
Не пьет, не хамит и не спит: универсальные роботы-охранники Не пьет, не хамит и не спит: универсальные роботы-охранники

Россию можно назвать мировой столицей частных охранных предприятий

Популярная механика
«Мы свидетели нового дополненного мира» «Мы свидетели нового дополненного мира»

Подборка высказываний футурологов и предпринимателей об Индустрии 4.0

РБК
Александр Раппопорт — о российской гастрономии и новых проектах Александр Раппопорт — о российской гастрономии и новых проектах

14 октября состоялось техническое открытие нового греческого ресторана

РБК
От большого к малому От большого к малому

Если ты хочешь лидерства, то должен бежать вдвое быстрее других

РБК
«А ведь раньше я съедала 4500 ккал в день!» «А ведь раньше я съедала 4500 ккал в день!»

Много лет понадобилось героине, чтобы понять, что жизнь состоит не только из еды

Худеем правильно
Мощные вещи Мощные вещи

Какова движущая сила Четвертой промышленной революции?

РБК
Андрей Житинкин: Андрей Житинкин:

Андрей Житинкин рассказывает о непростой, но увлекательной работе в театре

Караван историй
Геворк Вермишян: «5G — Это вызов, и мы его приняли» Геворк Вермишян: «5G — Это вызов, и мы его приняли»

Когда в России будет запущено пятое поколение мобильной связи?

РБК
Донецкая сенсация Донецкая сенсация

Творчество Кипренского всегда было предметом особого внимания широкой публики

Дилетант
Испытание огнем Испытание огнем

Современные газотурбинные двигатели в гражданской авиации — воплощение хай-тека

Популярная механика
Спокойной ночи! Секреты хорошего сна Спокойной ночи! Секреты хорошего сна

Как восстановить полноценный ночной отдых без таблеток

Psychologies
Опознанные объекты Опознанные объекты

Esquire рассказывает историю тоталитарной секты Heaven’s Gate

Esquire
10 самых сложных ультрамарафонов мира 10 самых сложных ультрамарафонов мира

Ультрамарафон — любая дистанция больше 42 км 195 м

РБК
Пришествие из виртуала Пришествие из виртуала

С середины 2010-х в мире стали популярны так называемые гонки на дронах

Популярная механика
Курс на цифру Курс на цифру

Заменят ли в будущем роботы живых людей на производстве

Русский репортер
Лена Горностаева Лена Горностаева

Какую часть мужского тела Лена Горностаева считает самой сексуальной?

Playboy
Тест Motorola One Action: смартфон и 4K экшн-камера в одном устройстве Тест Motorola One Action: смартфон и 4K экшн-камера в одном устройстве

Мы протестировали новый смартфон Motorola One Vision и делимся впечатлениями

CHIP
Все про детские обиды Все про детские обиды

О том, что такое детская обида и как с ней справиться

Psychologies
Звезды с агрессивным макияжем, который делает лицо Звезды с агрессивным макияжем, который делает лицо

Возьми на заметку и не повторяй без необходимости!

Cosmopolitan
Какой электрический теплый пол положить под плитку и ламинат? Какой электрический теплый пол положить под плитку и ламинат?

Какой электрический теплый пол лучше положить под плитку или ламинат

CHIP
Яростный танк Брэда Питта Яростный танк Брэда Питта

Слово Fury («ярость» — англ.) написано белой краской на стволе танка

Дилетант
Открыть в приложении