Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Храп — это нормально, а прививки вызывают аутизм: мифы о здоровье, в которые многие продолжают верить Храп — это нормально, а прививки вызывают аутизм: мифы о здоровье, в которые многие продолжают верить

Устаревшие представления о здоровье, в которые мы до сих пор верим

ТехИнсайдер
Чип, создавший современный мир Чип, создавший современный мир

Попытка понять законы развития важнейшей отрасли современной экономики

Монокль
ChatGPT превзошел врачей в оценке респираторных заболеваний у детей ChatGPT превзошел врачей в оценке респираторных заболеваний у детей

В оценке респираторных заболеваний ChatGPT показал лучшие результаты, чем врачи

ТехИнсайдер
Снимаем барьеры Снимаем барьеры

Как бороться с психологическими барьерами, мешающими жить полноценной жизнью

Лиза
10 новых сериалов, от которых невозможно оторваться 10 новых сериалов, от которых невозможно оторваться

Лучшие сериалы начала 2020-х годов, которые проглотят все ваше свободное время

Maxim
«Любовь — это все, что нам нужно?»: история одной клиентки психотерапевта «Любовь — это все, что нам нужно?»: история одной клиентки психотерапевта

Как клиенты с помощью психотерапии пытаются справиться с одиночеством?

Psychologies
Дом архитектора Дом архитектора

Линии судьбы наших героев пересеклись с линиями Васильевского острова

Seasons of life
Сиу-фактор: как Криштиану сделал своим командный жест «Реала» Сиу-фактор: как Криштиану сделал своим командный жест «Реала»

Как Криштиану Роналду искал свой фирменный стиль?

Forbes
Как нельзя использовать эфирные масла: 8 запретов, которые следует соблюдать Как нельзя использовать эфирные масла: 8 запретов, которые следует соблюдать

Можно ли навредить себе эфирными маслами?

VOICE
На краю земли На краю земли

Столетиями маяки выдерживают натиск стихии, подавая спасительные сигналы

Вокруг света
Ханты-Мансийск: мамонты и современное искусство Ханты-Мансийск: мамонты и современное искусство

В равнинах Западной Сибири, на слиянии Оби и Иртыша находится Ханты-Мансийск

Psychologies
Антиалкогольная компания Антиалкогольная компания

Десятка выдающихся пьяниц, алкоголиков и выпивающих героев мирового киноэкрана

Weekend
Тёплая осень 1964-го Тёплая осень 1964-го

«Не прошу милости — вопрос решён» — так Никита Хрущёв завершил своё выступление

Дилетант
Клептомания: что это такое, причины заболевания, симптомы и методы лечения Клептомания: что это такое, причины заболевания, симптомы и методы лечения

Разбираем, что такое клептомания простыми словами

Psychologies
Делиться, не владеть: как меняется рынок шеринга в России и в мире Делиться, не владеть: как меняется рынок шеринга в России и в мире

Почему рынок шеринга переживает бурный рост во всем мире?

ТехИнсайдер
Как заселяли Америку Как заселяли Америку

Когда именно и как шло расселение человека на американском континенте?

Наука и техника
Не хочу быть зависимой Не хочу быть зависимой

Что делать, если лекарство из средства экстренной помощи становится постоянным

Лиза
Бурлацкий стан Бурлацкий стан

Чем знаменито село Ширяево в Самарской области?

Отдых в России
8 признаков того, что вы злитесь на партнера, сами того не осознавая 8 признаков того, что вы злитесь на партнера, сами того не осознавая

Как понять, что вы утаиваете обиду на партнера?

Psychologies
Узлы на щитовидке Узлы на щитовидке

Чем опасны узлы в щитовидной железе?

Лиза
«Обе две»: драмеди с Кристиной Асмус, в котором женщины переосмысляют материнство «Обе две»: драмеди с Кристиной Асмус, в котором женщины переосмысляют материнство

Фильм «Обе две»: душевный и откровенный разговор о том, что болит у многих

Forbes
Мягкая сила Мягкая сила

Выбираем матрас для комфортного сна

Лиза
Вера в чудеса Вера в чудеса

Аттракционы небольшого города, раскинувшегося на обоих берегах Волги, — Тутаева

Отдых в России
Недвижимость Недвижимость

Российские девелоперы удивляют яркими проектами мирового уровня

RR Люкс.Личности.Бизнес.
Инвестиция в красоту: как капельницы стали частью современной бьюти-рутины Инвестиция в красоту: как капельницы стали частью современной бьюти-рутины

Почему капельницы стали так популярны в косметологии?

Forbes
Иван Янковский, самосуд и ельцинская Россия: каким получился сериал «Аутсорс»? Иван Янковский, самосуд и ельцинская Россия: каким получился сериал «Аутсорс»?

О параллелях, смыслах и оглушающем эффекте сериала «Аутсорс»

Правила жизни
Такой простой и трудный ЗОЖ Такой простой и трудный ЗОЖ

Точного определения того, что означает ЗОЖ, практически не существует

Здоровье
Нашлись звезды Нашлись звезды

Может ли самой свободной поп-группой наших дней быть и самая безобидно приятная?

СНОБ
Губаны-чистильщики оценили размеры своего тела относительно других благодаря зеркалу Губаны-чистильщики оценили размеры своего тела относительно других благодаря зеркалу

Губаны-чистильщики способны формировать ментальный образ собственного тела

N+1
Для чего нужны странные черные бочки на станциях метро Для чего нужны странные черные бочки на станциях метро

Что это за черный ящик Пандоры, который стоит на платформах метрополитена?

ТехИнсайдер
Открыть в приложении