Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Молекулы, необходимые для жизни, найдены в образцах астероида Бенну Молекулы, необходимые для жизни, найдены в образцах астероида Бенну

В породе, доставленной с астероида Бенну, обнаружены 14 из 20 аминокислот

ТехИнсайдер
Почему на ногах остаются следы от резинки носков? Это не обязательно отек Почему на ногах остаются следы от резинки носков? Это не обязательно отек

Следы от резинок носков могут быть временным и совершенно нормальным явлением

ТехИнсайдер
Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция? Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдер
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Космизмом сегодня называют целый ряд философских течений

Наука и жизнь
7 самых распространенных способов обмана на шиномонтаже 7 самых распространенных способов обмана на шиномонтаже

Как не попасться на крючок мошенников в шиномонтаже

Maxim
Секреты Софи Секреты Софи

Правила ухода со собой легендарной актрисы Софи Лорен

Лиза
Бизнес на вау-эффекте Бизнес на вау-эффекте

Какими факторами обусловлен бурный рост косметической компании «Гельтек»

Монокль
Клептомания: что это такое, причины заболевания, симптомы и методы лечения Клептомания: что это такое, причины заболевания, симптомы и методы лечения

Разбираем, что такое клептомания простыми словами

Psychologies
Как можно использовать мяту в быту: 8 потрясающих идей Как можно использовать мяту в быту: 8 потрясающих идей

Вариантов, как можно применить мяту в быту, на самом деле целое множество!

ТехИнсайдер
Кто придумал Гамлета? Кто придумал Гамлета?

Гамлет, принц датский, впервые увидел свет задолго до Шекспира

Дилетант
Не только скорость Не только скорость

Скорость у лодок Pershing не является альтернативой эстетики и комфорта

Y Magazine
Конечно, Вася Конечно, Вася

Василий Баста Вакуленко о самокритике, драках и творческих альтер эго

Men Today
На Alibaba нашлась машинка для производства алмазов за скромные деньги. Но есть подвох На Alibaba нашлась машинка для производства алмазов за скромные деньги. Но есть подвох

Можно ли делать алмазы в гараже?

ТехИнсайдер
Пьет значит жив Пьет значит жив

Как запой оказался единственной живой темой «Живого трупа»

Weekend
На приеме у психолога Аристокла: проблемы человека XXI века глазами древних греков На приеме у психолога Аристокла: проблемы человека XXI века глазами древних греков

Историо-Терапия: можно ли в прошлом найти ответы на непростые вопросы?

Psychologies
Икра белыми Икра белыми

Чем опасен нелегальный рынок икры для государства и потребителей

Деньги
Утро вечера на самом деле мудренее! Ученые выяснили, как сон влияет на решения Утро вечера на самом деле мудренее! Ученые выяснили, как сон влияет на решения

«Переспать с мыслью» действительно помогает делать более рациональный выбор

ТехИнсайдер
Сначала на себя Сначала на себя

Как понять, что ты обделяешь самого главного человека в своей жизни

VOICE
7 признаков того, что отношения не сложатся 7 признаков того, что отношения не сложатся

Точно ли ваши с партнером взгляды на совместное будущее совпадают?

Psychologies
Оттолкнуться от дна Оттолкнуться от дна

Из-за чего могут исчезнуть десятки российских рек?

Наука
«Билборды» и «Обстоятельства»: из чего состоит наш современный рок? «Билборды» и «Обстоятельства»: из чего состоит наш современный рок?

Молодые музыканты российской рок-сцены узких жанров

Правила жизни
Почему доминирование — это архаичная форма лидерства Почему доминирование — это архаичная форма лидерства

Как меняются формы лидерства?

Forbes
Симуляция жизни: каким будет мир через несколько лет при развитии цифровых двойников Симуляция жизни: каким будет мир через несколько лет при развитии цифровых двойников

Как будет развиваться рынок цифровых двойников и каким образом изменит мир

Forbes
Между первым и вторым Между первым и вторым

«Чужой: Ромул»: очень осторожный новый эпизод культовой франшизы

Weekend
«Как живем, так и шутим»: вспоминая Александра Васильевича Маслякова «Как живем, так и шутим»: вспоминая Александра Васильевича Маслякова

Светлана Мудрик вспоминает мэтра, под чьим руководством начинала свой путь

Правила жизни
Почему евреи мигрировали в США и стали важной частью американской культуры Почему евреи мигрировали в США и стали важной частью американской культуры

Миграция евреев в США оказала значительное влияние на развитие культуры

ТехИнсайдер
Что такое Германская Новая Медицина и чем она опасна: объяснение врача Что такое Германская Новая Медицина и чем она опасна: объяснение врача

Германская Новая Медицина — метод лечения, считающийся шарлатанством

Psychologies
Куда поедут российские шрот и жом Куда поедут российские шрот и жом

Пошлины на импорт продукта в ЕС могут привести к профициту на внутреннем рынке

Агроинвестор
5 неочевидных признаков того, что ваши отношения идут к концу 5 неочевидных признаков того, что ваши отношения идут к концу

Как понять, боретесь ли вы с временными трудностями, или союзу пришел конец?

VOICE
Как заниматься анальным сексом, как подготовиться и что делать, если вам не понравилось Как заниматься анальным сексом, как подготовиться и что делать, если вам не понравилось

В чем секрет удачного анального секса? Как получить от него удовольствие?

Psychologies
Открыть в приложении