Как избавляться от цифрового мусора и кому можно поручить эту работу?

РБКHi-Tech

Чистая работа

Как утилизаторы спасают мир от цифрового мусора и где можно освоить эту профессию

Авторы: Мария Решетникова, Андрей Абрамов

Фото: Gorodenkoff / Shutterstock / FOTODOM

Копии видеозаписей, дубли фотоснимков и ненужные письма в почте — каждый из нас ежедневно производит множество файлов, которые постепенно превращаются в цифровой мусор. Как от него избавляться и кому можно поручить эту работу?

Кто такой утилизатор цифрового мусора

Утилизатор цифрового мусора в сфере big data — это специалист, который занимается сортировкой, систематизацией и уничтожением лишних данных как на физических носителях, так и в облачных хранилищах.

Ежегодно основной объем ненужной информации растет за счет развития сферы больших данных. В 2023 году в мире генерировалось 120 зеттабайт (Зб) данных, или 328,77 млн терабайт в день, а к 2025 году этот объем составит более 180 Зб. Big data могут перегружать системы, поэтому растет потребность в профессионалах, которые могут чистить носители от лишней информации, копий и «битых» данных, чтобы избежать переполнения серверов.

Сфера задач

Специалист этой профессии будет анализировать данные в Сети при помощи инструментов big data и разрабатывать специальные алгоритмы, которые автоматически удаляют лишнюю информацию. Отдельные специалисты также будут работать над новыми способами сжатия файлов для снижения их «веса».

Утилизатор может работать не только с системами компаний, но и с данными, которые производит любой пользователь интернета, когда посещает сайты, отправляет письма или совершает другие действия в онлайне. Такой специалист способен выявлять дублирующую информацию, спам-рассылки, старые переписки и неработающие или вредоносные файлы, которые находятся в Сети и переносятся с одного сервера на другой.

Основные навыки

Поскольку работа утилизатора цифрового мусора, по сути, связана с профессиями дата-инженера и отчасти — дата-аналитика, то такому сотруднику потребуются знания:

  • структур данных и математических алгоритмов — это позволит понимать, как именно хранятся данные, чтобы правильно извлекать их и обрабатывать;
  • языков программирования: на Python пишутся алгоритмы для обработки данных, а на Java и Scala — инструменты для обработки данных;
  • SQL (структурированного языка запросов) и баз данных: такие запросы позволяют извлекать информацию из баз данных;
  • инструментов для работы с большими данными;
  • облачных технологий — во многих компаниях работа с данными ведется именно в облаках;
  • основ машинного обучения: навыки работы с ИИ помогут в моделировании данных и статистическом анализе, а внедрение новых инструментов позволит автоматизировать многие процессы.

Тренды в профессии

По данным аналитиков ReportLinker, в ближайшие годы индустрию обработки big data ожидает значительный подъем, вызванный спросом на аналитические данные в различных секторах.

Прогнозируется, что мировой рынок науки о данных будет расти в среднем ежегодно на 15,6% с 2023 по 2027 год. Его подъем будет обусловлен несколькими ключевыми факторами, в том числе быстрым развитием искусственного интеллекта и машинного обучения, а также растущим объемом структурированных и неструктурированных данных, генерируемых предприятиями.

Ожидается, что глобальный рынок платформ для обработки данных вырастет с нынешних $189,5 млрд до $1,1 трлн к 2030 году, а среднегодовой темп роста составит 25%. Это объясняется несколькими трендами:

  • ростом больших данных — с развитием интернета вещей, социальных сетей и других источников данных компаниям требуется больше специалистов по обработке и фильтрации информации;
  • фокусом на принятии решений на основе данных — чтобы анализировать массивы информации, ее нужно сначала отфильтровать и визуализировать;
  • появлением расширенной аналитики — машинное обучение и другие передовые методы аналитики требуют расширенной поддержки, в том числе в управлении хранением и извлечением данных;
  • спросом на обработку данных в реальном времени. Поскольку вакансий утилизаторов цифрового мусора на российском рынке пока нет, то говорить о зарплатах тоже преждевременно.

Однако можно примерно оценить их, если посмотреть, сколько получают специалисты смежных специальностей. Судя по объявлениям на HeadHunter, зарплаты дата-инженеров начинаются от 100 тыс. руб. По данным портала «Работа.ру», средняя зарплата инженера по работе с данными составляет 230 тыс.

Происхождение профессии

Работу утилизатора можно назвать смежной с работой дата-инженера, который собирает данные, очищает их и структурирует, а также настраивает загрузку и движение данных между инструментами. Однако около 80% рабочего времени таких специалистов уходит именно на очистку данных. При растущем объеме информации эти обязанности начнут исполнять утилизаторы цифрового мусора.

Соцсеть LinkedIn включила инженера по обработке данных в отчет о новых вакансиях за 2020 год, который показал, что темпы роста найма профессионалов на эту должность увеличились почти на 35% с 2015 года. По подсчетам аналитиков компании Zippia, число вакансий дата-инженеров вырастет на 21% к 2028 году по сравнению с 2018 годом.

Фото: Gorodenkoff / Shutterstock / FOTODOM

Как стать утилизатором цифрового мусора

В российских университетах и онлайн-школах пока нет обучающих программ по этому направлению. Чтобы подготовить себя к будущей работе утилизатором цифрового мусора, можно пройти обучение по профессии дата-инженера. Это позволит получить представление о том, как работать с большими данными и технологиями машинного обучения. Программных инженеров готовят такие вузы, как МГТУ имени Баумана, НИЯУ МИФИ, РТУ МИРЭА и НИУ ВШЭ.

Также можно пройти онлайн-обучение по специальности дата-инженера и дата-саентиста. Их предлагают Skillbox, SkillFactory, «Яндекс. Практикум», «Нетология», Productstar и другие образовательные платформы.

При наличии опыта работы в IT можно пройти и отдельные курсы, которые позволят получить важные для специальности базовые навыки, например бесплатный курс по основам программирования на Python или по SQL от Codeacademy. Курсы по алгоритмам и инструментам работы с базами данных можно найти на ресурсе Stepik. Кроме того, существует множество подборок бесплатных ресурсов, книг и видеоуроков по профессии.

Какие еще профессии будут востребованы в сфере работы с данными в будущем

IT — одна из самых быстрорастущих отраслей экономики. Цифровые технологии проникли во все сферы жизни. Нас повсюду окружают данные, поэтому сфера информационных технологий гарантирует рабочие места специалистам, умеющим с ними работать: от дата-журналиста до архитектора данных.

«РБК Тренды» составили список 150 самых востребованных профессий будущего. Помимо утилизаторов цифрового мусора в ближайшие 30 лет в сфере big data, IT и работы с информацией успешную карьеру смогут построить представители следующих профессий.

  • Дата-журналист — специалист, который анализирует и собирает большие данные, чтобы затем на их основе готовить статьи, заметки и прочие форматы журналистских материалов, включая интерактивные.
  • Консультант по безопасности личного профиля формирует информационный образ клиента в интернете, собирая всю информацию, которая о нем доступна. Проводит аудит безопасности пользователя в Сети и предлагает методы, чтобы ее усилить.
  • Инженер квантовых компьютеров будет работать на специализированных языках программирования для мощных и сложных компьютеров, чтобы решать новые задачи.
  • Инженер VR и AR создает программы виртуальной и дополненной реальности для смартфонов, ПК, шлемов, очков. VR/AR-технологии востребованы в играх и различных приложениях, применяемых не только для развлечения, но и, например, для обучения.
  • AI-тренер — редактор настоящего и будущего, проверяющий тексты, которые создают нейросети. Представители этой специальности также учат нейросети разговаривать подобно живым людям.
  • Брокер данных — специалист, который продает данные, собранные людьми, сообществами и корпорациями. Эта информация передается в алгоритмы машинного обучения для самых разных целей.
  • Медиаполицейский — сотрудник правоохранительных органов на просторах Сети. Борется с противоправным контентом, киберпреступниками, в том числе теми, кто совершает преступления против личности (кибербуллинг, сталкинг, интернет-мошенничество).

Подробнее об этих и других перспективных специальностях — в подборке РБК «150 профессий будущего».

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Попали в историю Попали в историю

Какие цифровые данные оставляют пользователи в Сети и для чего их собирают

РБК
Катерина Киндрук: Исторический момент ставит перед бизнесом нестандартные задачи Катерина Киндрук: Исторический момент ставит перед бизнесом нестандартные задачи

Какими качествами нужно обладать эффективному топ-менеджеру?

СНОБ
Екатерина Гусева: «Муж наконец-то сделал мне предложение» Екатерина Гусева: «Муж наконец-то сделал мне предложение»

Мне всегда было очень важно, чтобы и на работе, и дома меня окружали родные души

Караван историй
Как образ жизни влияет на качество секса: 3 ключевых фактора Как образ жизни влияет на качество секса: 3 ключевых фактора

Как изменения в образе жизни могут повлиять на сексуальную жизнь?

Psychologies
Метод шифрования будущего Метод шифрования будущего

Что такое постквантовая криптография и от каких киберугроз она сможет защитить

РБК
Убийца прокрастинации: как работать по технике «Помодоро» Убийца прокрастинации: как работать по технике «Помодоро»

Как выполнять задачи эффективно и все успевать благодаря технике «Помодоро»

ТехИнсайдер
Облегчение не в радость: почему падает загрузка сети РЖД Облегчение не в радость: почему падает загрузка сети РЖД

Погрузка сети РЖД снижается уже более полугода. Основные причины

Forbes
Заповеди женского полка: отрывок из книги о бомбардировщицах — героях Великой Отечественной войны Заповеди женского полка: отрывок из книги о бомбардировщицах — героях Великой Отечественной войны

Воспоминания писателя Бориса Ласкина о женщинах на войне

СНОБ
50 000 подносов и рязанская Венеция: кто и как возрождает народные промыслы 50 000 подносов и рязанская Венеция: кто и как возрождает народные промыслы

Кто развивает традиционные промыслы и как пытается на этом заработать

Forbes
«По закону они просто вещи»: кто и как в России спасает животных во время катастроф «По закону они просто вещи»: кто и как в России спасает животных во время катастроф

Как фонды и волонтеры вызволяют питомцев, оставленных в зоне затопления

Forbes
Список на лето: 7 важных книг для подростков Список на лето: 7 важных книг для подростков

7 небанальных, но важных книг для людей 12–18 лет

СНОБ
7 фраз, которые нельзя говорить самому себе 7 фраз, которые нельзя говорить самому себе

Некоторые установки по-настоящему токсичны, и их лучше избегать

Maxim
Больше молока от фермы до прилавка Больше молока от фермы до прилавка

Производство сырья и готовой продукции в молочном секторе будет увеличиваться

Агроинвестор
Галина и Евгений Киндиновы: «Коля долго не женился. Конечно же, романы у него были, но не с актрисами» Галина и Евгений Киндиновы: «Коля долго не женился. Конечно же, романы у него были, но не с актрисами»

Близкие друзья откровенно о Николае Караченцове

Коллекция. Караван историй
Человек с большой цифры Человек с большой цифры

Как технологии лишают нас сна, памяти, эмпатии и отучают знакомиться

Men Today
Что такое Ватсу: обзор популярной телесно-ориентированной практики Что такое Ватсу: обзор популярной телесно-ориентированной практики

Практика Ватсу: как она проходит и влияет на состояние человека

Psychologies
Мария Аниканова: «Сергей Соловьев написал за меня сочинение, когда я призналась, что никогда в жизни его не напишу» Мария Аниканова: «Сергей Соловьев написал за меня сочинение, когда я призналась, что никогда в жизни его не напишу»

«У Соловьева на площадке царила особая атмосфера, которая просто обволакивала»

Караван историй
Медные слитки из минойского дворца Агия-Триада отлили из уральской руды Медные слитки из минойского дворца Агия-Триада отлили из уральской руды

Ученые проанализировали состав 15 медных слитков, обнаруженных на Крите

N+1
Битва за Берлин: квинтэссенция опыта советской армии Битва за Берлин: квинтэссенция опыта советской армии

Как проходила финальная битва Великой Отечественной войны

Монокль
Солнце в бокале Солнце в бокале

Лучшим выбором для романтического ужина будут игристые и красные вина

Лиза
Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино» Почему мы любим делать несколько дел сразу: пример «обеда за просмотром кино»

Есть, отвлекаясь на сериал, — один из самых простых способов переесть

ТехИнсайдер
Как вам продают саморазвитие (и очень дорого!) — объясняет психолог Татьяна Мужицкая Как вам продают саморазвитие (и очень дорого!) — объясняет психолог Татьяна Мужицкая

Насколько стремление блогеров и коучей помочь людям искренне и бесскорыстно?

Psychologies
«Претенденты»: спортивная драма с Зендеей о поединке на теннисном корте и в любви «Претенденты»: спортивная драма с Зендеей о поединке на теннисном корте и в любви

«Претенденты»: чего не хватило этой истории о любовном треугольнике на корте

Forbes
10 автомобилей Джеймса Бонда — от худшего к лучшему 10 автомобилей Джеймса Бонда — от худшего к лучшему

Автомобили — важная часть любого фильма о Джеймсе Бонде. А какими они были?

Maxim
Борьба с течением: как за рубежом регулируют сферу кибербезопасности Борьба с течением: как за рубежом регулируют сферу кибербезопасности

Опыт стран, которые работают с утечками данных на системном уровне

Forbes
Букет — маме, жене — цветок: новый тренд возмутил пользователей соцсетей Букет — маме, жене — цветок: новый тренд возмутил пользователей соцсетей

Кто дороже: мама или жена? Каждая занимает особое место в сердце мужчины

Psychologies
На склонах Окского каньона На склонах Окского каньона

Ока здесь течёт в узкой долине, за что она и получила название Окского каньона

Наука и жизнь
Обмен дарами: почему мы так нуждаемся в отношениях Обмен дарами: почему мы так нуждаемся в отношениях

Почему мы нуждаемся друг в друге и как закрепить значимые для нас связи?

Psychologies
Сериал «Олененок»: почему история о сталкинге так затягивает Сериал «Олененок»: почему история о сталкинге так затягивает

Как и почему сериал о сталкинге «Олененок» завоевал так много поклонников

Psychologies
10 способов справиться со стрессом: только наука! 10 способов справиться со стрессом: только наука!

Научно обоснованные методы помогут вам защитить свое тело и мозг от стресса

ТехИнсайдер
Открыть в приложении