«Цифровой след оставляют все»
Слияние данных из разных источников — технология и настоящего, и будущего. Сегодня она дает возможность работать с big data, завтра будет способствовать появлению множества новых продуктов. О том, как технология помогает в достижении бизнес-результатов и о чем будут говорить участники первой международной конференции Data Fusion — в интервью Максима Коновалихина, главы департамента анализа данных и моделирования ВТБ
Инвестиционный портфель соберет робот
— В начале марта 2021 года Министерство цифрового развития заявило о планах ужесточить требования к обороту информации, приравняв обезличенные данные к персональным. Соответственно, использовать такую информацию без согласия человека станет невозможно. Ставку на работу с обезличенными данными ВТБ делает в последние полтора года. Не придется ли что-то менять?
— Не думаю, что инициатива министерства будет реализована именно в таком формате. Если данные обезличены, какой вред они могут нанести? Не говоря о том, что просить согласия гражданина на обработку его обезличенных данных априори невозможно. Вопрос использования персональных данных действительно очень чувствительный: все мы страдаем от навязчивых звонков, предлагающих ненужные сервисы и услуги. Однако подходить к решению следует, не создавая избыточных требований, а встав на сторону и граждан, и бизнеса.
Цифровизация — повседневная реальность нашей жизни.
Нужно не игнорировать этот факт, а искать новый путь, который всех устроит.
— Как может выглядеть этот путь для ВТБ, располагающего гигантским объемом данных?
— Чем шире поле данных, тем интереснее будут результаты обработки, детальнее картина знания о клиентах и больше новых граней для партнерства. Соответственно, выше и градус интереса бизнеса. Согласно законодательству, банк не может передавать данные для обработки третьему лицу. Но и, располагая такими гигантскими массивами, не пользоваться ими было бы неправильно. Поэтому наша главная задача — найти решение, устраивающее всех участников. Концепция Data Fusion, предлагающая объединение массивов обезличенных данных и глубокую синергию в процессе машинного обучения моделей, способна решить эту задачу максимально эффективно.
— Подобный же принцип know your costumer — знай своего клиента — появился на мировом рынке больше двадцати лет назад, он давно и активно используется глобальными компаниями, например, Amazon. В чем заключаются ключевые отличия технологии Data Fusion?
— Действительно, идея Data Fusion не нова. Однако для перечисленных концепций важен сбор данных и способы регулирования этих процессов, в то время как Data Fusion не ограничивается простым объединением клиентских данных. С этого все только начинается: когда у вас есть все возможные данные, которые сегодня можно получить, «в игру» вступают алгоритмы машинного обучения. Для начала персональные данные преобразуются в обезличенные вектора, которые, что крайне важно, не поддаются расшифровке, и поэтому дальнейшая работа с ними безопасна. Преобразованные данные отлично подходят для формирования моделей. Следующий шаг — обучение моделей при помощи различных технологий, от криптографии до атипичных граф и сложных алгоритмов нейросетей. Модели могут быть помещены в разные массивы данных, не только наши, но и наших партнеров, или могут обучаться на отдельных зашифрованных фрагментах. При этом цифровые следы есть не только у физических, но и у юридических лиц, их тоже можно задействовать в алгоритмах машинного обучения.