От больших данных ждут большего
Рынок решений для работы с данными через три года вырастет в два с половиной раза и будет почти полностью занят российскими игроками. Резкий отказ от западного ПО запустил процесс кардинального обновления систем для работы с большими данными, на что бизнес еще долго бы не решился
«То, что происходит сейчас, — аналог 90-х годов: масса вариантов, все бегают, денег до черта» — так описал происходящее на российском IT-рынке в целом и на рынке решений для работы с большими данными в частности на IV конференции ArenaDay член совета директоров «Диасофта» Александр Генцис.
Энтузиазм IT-сообщества неудивителен: во-первых, сам рынок решений по хранению и обработке больших данных бурно растет: по прогнозу фонда «Центр стратегических разработок», к 2027 году он достигнет 170 млрд рублей, а среднегодовой темп роста составит 25%. Компании буквально тонут в данных, которые непрерывно копятся: объем неструктурированных данных к 2026 году по сравнению с 2023-м утроится.
Озера данных перелились через край
Уже сейчас банки и другие отрасли, работающие с огромным числом розничных клиентов, владеют внушительными объемами информации: так, у «Почты России» в аналитическом хранилище более 7 петабайт (Пб) данных, у Газпромбанка более 3 Пб. Эти объемы трудно себе представить, но некоторое понимание может дать тот факт, что 1 Пб — это 500 млрд страниц текста, то есть миллиард толстых книг по 500 страниц, больше, чем в десяти самых крупных библиотеках мира, вместе взятых.
И это не пассивно хранящиеся данные, а данные, к которым информационные системы постоянно обращаются. Плюс пользователи ежесекундно добавляют новые данные, и часто исходя из этого нужно что-то менять — например, пересчитывать остаток денег на банковском счете, когда клиент совершает покупку, или помечать доставленным письмо, которое клиент забрал.
Даже просто поддерживать порядок в этом информационном хозяйстве — сложная задача, для решения которой уже изобретены специальные программы: для «очистки» данных от ошибок, для их каталогизации и т. д.
Во-вторых, российские вендоры сейчас оказались единственными игроками на отечественном рынке: Oracle, SAP и прочие зарубежные компании, предоставлявшие продукты для обработки больших данных, в одночасье ушли с российского рынка. Еще в 2021 году правительство озаботилось тем, чтобы объекты критической информационной инфраструктуры (КИИ) — госорганы, банки, объекты транспорта, связи, здравоохранения, предприятия оборонной, топливной и атомной промышленности и энергетики — были переведены на отечественное ПО, а весной 2022 года тем, кто делает закупки по 223-ФЗ, вообще запретили покупать зарубежное ПО. В итоге доля российских вендоров на рынке решений для больших данных, по оценке одного из крупнейших игроков этого рынка Arenadata, буквально за пару лет вырастет с 66 до 98% (см. график). Впрочем, генеральный директор Группы Arenadata