Как избавляться от цифрового мусора и кому можно поручить эту работу?

РБКHi-Tech

Чистая работа

Как утилизаторы спасают мир от цифрового мусора и где можно освоить эту профессию

Авторы: Мария Решетникова, Андрей Абрамов

Фото: Gorodenkoff / Shutterstock / FOTODOM

Копии видеозаписей, дубли фотоснимков и ненужные письма в почте — каждый из нас ежедневно производит множество файлов, которые постепенно превращаются в цифровой мусор. Как от него избавляться и кому можно поручить эту работу?

Кто такой утилизатор цифрового мусора

Утилизатор цифрового мусора в сфере big data — это специалист, который занимается сортировкой, систематизацией и уничтожением лишних данных как на физических носителях, так и в облачных хранилищах.

Ежегодно основной объем ненужной информации растет за счет развития сферы больших данных. В 2023 году в мире генерировалось 120 зеттабайт (Зб) данных, или 328,77 млн терабайт в день, а к 2025 году этот объем составит более 180 Зб. Big data могут перегружать системы, поэтому растет потребность в профессионалах, которые могут чистить носители от лишней информации, копий и «битых» данных, чтобы избежать переполнения серверов.

Сфера задач

Специалист этой профессии будет анализировать данные в Сети при помощи инструментов big data и разрабатывать специальные алгоритмы, которые автоматически удаляют лишнюю информацию. Отдельные специалисты также будут работать над новыми способами сжатия файлов для снижения их «веса».

Утилизатор может работать не только с системами компаний, но и с данными, которые производит любой пользователь интернета, когда посещает сайты, отправляет письма или совершает другие действия в онлайне. Такой специалист способен выявлять дублирующую информацию, спам-рассылки, старые переписки и неработающие или вредоносные файлы, которые находятся в Сети и переносятся с одного сервера на другой.

Основные навыки

Поскольку работа утилизатора цифрового мусора, по сути, связана с профессиями дата-инженера и отчасти — дата-аналитика, то такому сотруднику потребуются знания:

  • структур данных и математических алгоритмов — это позволит понимать, как именно хранятся данные, чтобы правильно извлекать их и обрабатывать;
  • языков программирования: на Python пишутся алгоритмы для обработки данных, а на Java и Scala — инструменты для обработки данных;
  • SQL (структурированного языка запросов) и баз данных: такие запросы позволяют извлекать информацию из баз данных;
  • инструментов для работы с большими данными;
  • облачных технологий — во многих компаниях работа с данными ведется именно в облаках;
  • основ машинного обучения: навыки работы с ИИ помогут в моделировании данных и статистическом анализе, а внедрение новых инструментов позволит автоматизировать многие процессы.

Тренды в профессии

По данным аналитиков ReportLinker, в ближайшие годы индустрию обработки big data ожидает значительный подъем, вызванный спросом на аналитические данные в различных секторах.

Прогнозируется, что мировой рынок науки о данных будет расти в среднем ежегодно на 15,6% с 2023 по 2027 год. Его подъем будет обусловлен несколькими ключевыми факторами, в том числе быстрым развитием искусственного интеллекта и машинного обучения, а также растущим объемом структурированных и неструктурированных данных, генерируемых предприятиями.

Ожидается, что глобальный рынок платформ для обработки данных вырастет с нынешних $189,5 млрд до $1,1 трлн к 2030 году, а среднегодовой темп роста составит 25%. Это объясняется несколькими трендами:

  • ростом больших данных — с развитием интернета вещей, социальных сетей и других источников данных компаниям требуется больше специалистов по обработке и фильтрации информации;
  • фокусом на принятии решений на основе данных — чтобы анализировать массивы информации, ее нужно сначала отфильтровать и визуализировать;
  • появлением расширенной аналитики — машинное обучение и другие передовые методы аналитики требуют расширенной поддержки, в том числе в управлении хранением и извлечением данных;
  • спросом на обработку данных в реальном времени. Поскольку вакансий утилизаторов цифрового мусора на российском рынке пока нет, то говорить о зарплатах тоже преждевременно.

Однако можно примерно оценить их, если посмотреть, сколько получают специалисты смежных специальностей. Судя по объявлениям на HeadHunter, зарплаты дата-инженеров начинаются от 100 тыс. руб. По данным портала «Работа.ру», средняя зарплата инженера по работе с данными составляет 230 тыс.

Происхождение профессии

Работу утилизатора можно назвать смежной с работой дата-инженера, который собирает данные, очищает их и структурирует, а также настраивает загрузку и движение данных между инструментами. Однако около 80% рабочего времени таких специалистов уходит именно на очистку данных. При растущем объеме информации эти обязанности начнут исполнять утилизаторы цифрового мусора.

Соцсеть LinkedIn включила инженера по обработке данных в отчет о новых вакансиях за 2020 год, который показал, что темпы роста найма профессионалов на эту должность увеличились почти на 35% с 2015 года. По подсчетам аналитиков компании Zippia, число вакансий дата-инженеров вырастет на 21% к 2028 году по сравнению с 2018 годом.

Фото: Gorodenkoff / Shutterstock / FOTODOM

Как стать утилизатором цифрового мусора

В российских университетах и онлайн-школах пока нет обучающих программ по этому направлению. Чтобы подготовить себя к будущей работе утилизатором цифрового мусора, можно пройти обучение по профессии дата-инженера. Это позволит получить представление о том, как работать с большими данными и технологиями машинного обучения. Программных инженеров готовят такие вузы, как МГТУ имени Баумана, НИЯУ МИФИ, РТУ МИРЭА и НИУ ВШЭ.

Также можно пройти онлайн-обучение по специальности дата-инженера и дата-саентиста. Их предлагают Skillbox, SkillFactory, «Яндекс. Практикум», «Нетология», Productstar и другие образовательные платформы.

При наличии опыта работы в IT можно пройти и отдельные курсы, которые позволят получить важные для специальности базовые навыки, например бесплатный курс по основам программирования на Python или по SQL от Codeacademy. Курсы по алгоритмам и инструментам работы с базами данных можно найти на ресурсе Stepik. Кроме того, существует множество подборок бесплатных ресурсов, книг и видеоуроков по профессии.

Какие еще профессии будут востребованы в сфере работы с данными в будущем

IT — одна из самых быстрорастущих отраслей экономики. Цифровые технологии проникли во все сферы жизни. Нас повсюду окружают данные, поэтому сфера информационных технологий гарантирует рабочие места специалистам, умеющим с ними работать: от дата-журналиста до архитектора данных.

«РБК Тренды» составили список 150 самых востребованных профессий будущего. Помимо утилизаторов цифрового мусора в ближайшие 30 лет в сфере big data, IT и работы с информацией успешную карьеру смогут построить представители следующих профессий.

  • Дата-журналист — специалист, который анализирует и собирает большие данные, чтобы затем на их основе готовить статьи, заметки и прочие форматы журналистских материалов, включая интерактивные.
  • Консультант по безопасности личного профиля формирует информационный образ клиента в интернете, собирая всю информацию, которая о нем доступна. Проводит аудит безопасности пользователя в Сети и предлагает методы, чтобы ее усилить.
  • Инженер квантовых компьютеров будет работать на специализированных языках программирования для мощных и сложных компьютеров, чтобы решать новые задачи.
  • Инженер VR и AR создает программы виртуальной и дополненной реальности для смартфонов, ПК, шлемов, очков. VR/AR-технологии востребованы в играх и различных приложениях, применяемых не только для развлечения, но и, например, для обучения.
  • AI-тренер — редактор настоящего и будущего, проверяющий тексты, которые создают нейросети. Представители этой специальности также учат нейросети разговаривать подобно живым людям.
  • Брокер данных — специалист, который продает данные, собранные людьми, сообществами и корпорациями. Эта информация передается в алгоритмы машинного обучения для самых разных целей.
  • Медиаполицейский — сотрудник правоохранительных органов на просторах Сети. Борется с противоправным контентом, киберпреступниками, в том числе теми, кто совершает преступления против личности (кибербуллинг, сталкинг, интернет-мошенничество).

Подробнее об этих и других перспективных специальностях — в подборке РБК «150 профессий будущего».

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Попали в историю Попали в историю

Какие цифровые данные оставляют пользователи в Сети и для чего их собирают

РБК
Внутреннее ощущение «красоты» важнее, чем внешность Внутреннее ощущение «красоты» важнее, чем внешность

Намного важнее чувствовать себя хорошо, чем выглядеть хорошо

ТехИнсайдер
Воздушный океан... Воздушный океан...

Мы все живём где-то на дне воздушного океана

Наука и жизнь
Избавляемся от пятен и запаха: 3 лайфхака, как стирать стельки Избавляемся от пятен и запаха: 3 лайфхака, как стирать стельки

Как ухаживать за стельками в обуви?

ТехИнсайдер
Ген памяти Ген памяти

Какие альтернативные накопители предлагают на рынке хранения данных

РБК
Мария Михалкова-Кончаловская: «Я пытаюсь отучиться бросаться в омут с головой» Мария Михалкова-Кончаловская: «Я пытаюсь отучиться бросаться в омут с головой»

Молодая актриса рассказала, каково принадлежать к влиятельной актерской династии

Maxim
От комичного до трагичного: кто и как играл Зигмунда Фрейда в кино От комичного до трагичного: кто и как играл Зигмунда Фрейда в кино

Кто и как играл австрийского психоаналитика на экране?

Правила жизни
9 главных разочарований в жизни каждого человека 9 главных разочарований в жизни каждого человека

Подборка того, в чем многие люди разочаровываются чаще всего

Psychologies
«Мысль о тебе»: как новый ромком с Энн Хэтэуэй критикует эйджизм в отношении женщин «Мысль о тебе»: как новый ромком с Энн Хэтэуэй критикует эйджизм в отношении женщин

Как «Мысль о тебе» обличает эйджизм, но оправдывает токсичные отношения

Forbes
Майк Омер: «Женщины интереснее мужчин» Майк Омер: «Женщины интереснее мужчин»

Майк Омер: откуда он берет сюжеты и есть ли у его героинь черты реальных людей

Maxim
Как почистить посудомоечную машину в домашних условиях Как почистить посудомоечную машину в домашних условиях

Рассказываем, как быстро и легко вымыть посудомоечную машину

CHIP
Мексиканский кинорежиссер Мишель Франко: За каждой секундой на экране должно стоять художественное решение Мексиканский кинорежиссер Мишель Франко: За каждой секундой на экране должно стоять художественное решение

Режиссер Мишель Франко — о съемке драматичных историй и надежде на лучшее

СНОБ
Ольга Пескова: «Человечеству не нужно бояться альтернативной реальности» Ольга Пескова: «Человечеству не нужно бояться альтернативной реальности»

Как не раствориться в цифровом мире и сохранить свою человеческую идентичность?

РБК
Сказка о гендерном равенстве: почему женщины в России зарабатывают меньше мужчин Сказка о гендерном равенстве: почему женщины в России зарабатывают меньше мужчин

Откуда берется гендерное неравенство в зарплате?

Forbes
«Наша задача — не кости с места на место перенести, а достойно похоронить в братской могиле». Как в Московской области ищут останки пропавших без вести солдат «Наша задача — не кости с места на место перенести, а достойно похоронить в братской могиле». Как в Московской области ищут останки пропавших без вести солдат

Как поиск солдат из мальчишеского увлечения превратился в серьезную миссию

СНОБ
Не болей! Не болей!

5 признаков того, что твоя собака нездорова

Лиза
Как на телефоне обрезать музыку: приложения и онлайн-сервисы Как на телефоне обрезать музыку: приложения и онлайн-сервисы

Из любого трека можно сделать рингтон, но как обрезать музыку для звонка?

CHIP
«Не слишком ли много мы думаем?»: как правильно потреблять и перерабатывать информацию «Не слишком ли много мы думаем?»: как правильно потреблять и перерабатывать информацию

Похоже, мозг не справляется с тем валом информации, который обрушивается на нас

Psychologies
Что смотреть в выходные: 6 новых фильмов, которые вы могли пропустить Что смотреть в выходные: 6 новых фильмов, которые вы могли пропустить

Собрали шесть ярких фильмов, которые определенно стоят потраченного времени

Правила жизни
Варикоз: причины, профилактика и методы лечения Варикоз: причины, профилактика и методы лечения

Что приводит к развитию варикоза, как избежать заболевания?

Psychologies
Китайский закон о сидячем образе жизни повысил физическую активность детей Китайский закон о сидячем образе жизни повысил физическую активность детей

Ученые оценили влияние закона, регулирующего время доступа детей к онлайн-играм

N+1
Выход в «Космос»: как живет легендарная гостиница в холдинге, созданном Евтушенковым Выход в «Космос»: как живет легендарная гостиница в холдинге, созданном Евтушенковым

Строительство сети начиналось с легендарной советской гостиницы «Космос»

Forbes
К чему мы до сих пор не можем привыкнуть в китайских автомобилях К чему мы до сих пор не можем привыкнуть в китайских автомобилях

Поднебесная не перестает удивлять экзотическими решениями в своих авто

Maxim
Разрушаем главный гендерный стереотип: оказывается, женщины тоже охотились на мамонтов Разрушаем главный гендерный стереотип: оказывается, женщины тоже охотились на мамонтов

79% женщин были охотницами и продолжали охотиться даже после рождения детей

ТехИнсайдер
Незаменимый помощник орнитолога: как бинокль со встроенным искусственным интеллектом помогает определять виды птиц Незаменимый помощник орнитолога: как бинокль со встроенным искусственным интеллектом помогает определять виды птиц

Бинокль с искусственным интеллектом — shazam для орнитологов

ТехИнсайдер
5 отличных книг в жанре эпического фэнтези, о которых вы, скорее всего, не слышали 5 отличных книг в жанре эпического фэнтези, о которых вы, скорее всего, не слышали

На что обратить внимание поклонникам творчества Джона Толкина и Тэда Уильямса?

Maxim
РФ в БРИКС: «Мы нацелены на плотную работу с партнерами» РФ в БРИКС: «Мы нацелены на плотную работу с партнерами»

Ключевые аспекты работы БРИКС и участие РФ в этом объединении

ФедералПресс
6-летняя девочка делает макияж в детский сад: как поколение альфа рискует травмировать себя 6-летняя девочка делает макияж в детский сад: как поколение альфа рискует травмировать себя

Почему поколение альфа так одержимо макияжем и чем это может им навредить?

Psychologies
Выиграть жену Выиграть жену

Интеллектуальные игры сопровождали калмыков с детства

Вокруг света
Кто я, если не я Кто я, если не я

«Я не киллер»: Ричард Линклейтер о 1990-х и кризисе самоидентификации

Weekend
Открыть в приложении