Способен ли искусственный интеллект писать тексты или даже мыслить как человек?

МонокльHi-Tech

Феномен текста: человек vs ИИ

При правильно написанном промпте рассказ, сгенерированный нейросетью последнего поколения, не отличить от человеческого. Но прежде чем доверить сочинение боту, разберемся в нюансах

Валерия Бунина

Все больше людей используют тексты, написанные искусственным интеллектом. Открытой статистики на этот счет не существует (данные засекречены разработчиками и операторами связи), но известно, что, например, в 2024 году мобильный трафик и аудитория сервисов ИИ в России выросли в пять раз. Прошлогоднее исследование компании «Яндекс» показало: к нейросетям для генерации текста обращается треть пользователей Рунета, причем доля аудитории от 45 до 54 лет и старше 55 лет растет.

Есть и яркий пример «генерационного бума»: в апреле этого года газета «Краснодарские известия» выпустила номер, полностью написанный ИИ. Перед началом работы нейросеть обучали на десятках журналистских материалов, чтобы адаптировать к стилю издания. В итоге в номере появились такие материалы, как статьи «Сгенерированный судья будущего» и «Они заменят вас на работе».

Давайте разберемся в этих предвестниках «креативной революции»: действительно ли искусственный интеллект способен писать тексты или даже мыслить как человек?

Банальность или странный креатив

Для начала стоит успокоиться: в отличие от людей ИИ не понимает слова, которые пишет, а просто отыскивает закономерности в миллионах текстов. В основе нейросети лежит языковая модель — алгоритм, обученный на большом количестве текстов. Опираясь на заданную фразу — контекст, — модель предсказывает наиболее логичную последовательность слов. Ключевая задача, которую при этом решают разработчики, — сделать результат максимально приближенным к написанному человеком.

Технически это называется авторегрессионной генерацией. Модель получает цепочку слов на вход и вычисляет, какое следующее слово наиболее релевантно. Например, фразу «Левитан был» можно продолжить так: «человеком», «художником», «подданным Российской империи». ИИ оценивает каждый вариант и выбирает лучший. Одни алгоритмы настроены так, что лучшим признается фраза с наиболее часто встречающимся продолжением для известного контекста (в этом случае возможности постоянной генерации новых тестов ограниченны, так как нейросеть движется по одной колее), другие ориентированы на случайный выбор наиболее популярных вариантов (тексты получаются более разнообразными).

После добавления каждого нового слова действие повторяется — и так до тех пор, пока не будет достигнут лимит длины или не будет сгенерирован специальный символ завершения. Иногда нейросеть выдает текст из 20 слов, иногда из 120 — все зависит от того, в какой последовательности расположатся слова-токены.

Описание заката на море. Два из этих текстов созданы чат-ботами — GPT-4 и Deepseek, а один — Константином Паустовским. Чувствуете разницу?

На созданный ИИ текст могут влиять параметры, которые задает пользователь, например уровень креативности. Чем он выше, тем чаще модель будет выбирать редкие токены, делая написанное менее предсказуемым, порой очень странным. В случае с Левитаном нейросеть при высоком уровне креативности выбрала бы не «художник», а «подданный».

Еще один параметр — повторяемость. Модели склонны повторять стилистические шаблоны: для имитации стиля определенного писателя применяются инструкции в промпте.

«Процесс генерации основан на статистических закономерностях: ИИ не понимает содержание, а угадывает, какое слово или фраза лучше всего подходят в данном контексте, опираясь на свои тренировочные данные, — рассказывает руководитель научной группы “Технологии персонализации” института AIRI Евгений Фролов. — За последние пять лет развитие ИИ в области написания текстов прошло колоссальный путь. Возьмем для примера GPT. В 2018 году модель GPT-2, обученная на 1,5 миллиарда параметров, могла генерировать связные, но часто бессмысленные или ограниченные тексты. GPT-3, появившийся в 2020 году, был обучен на 175 миллиардах — в 117 раз больше, чем у предыдущей модели. Его тексты стали более естественными, точными и разнообразными. Для GPT-4, по оценкам экспертов, использовалось от 500 миллиардов до двух триллионов параметров — теперь нейросеть пишет эссе, стихи и даже диалоги, которые порой сложно отличить от созданных человеком. Такой прорыв стал возможен по нескольким причинам: увеличение объема данных для обучения, совершенствование алгоритмов, например введение методов дообучения с подкреплением, рост вычислительных мощностей. Благодаря последним были внедрены и механизмы, позволяющие моделям учитывать обратную связь от пользователей для улучшения стиля и точности ответов. Так что сегодня ИИ не просто генерирует текст — он адаптируется к конкретным задачам».

Проверяй и проверяй

При этом эксперты признают, что все искусственно созданные тексты имеют общую уязвимость: их «гениальный автор» не понимает того, о чем пишет. Сочинения нейросети собраны как конструктор «Лего», а смысл им придает читающий. Именно поэтому ИИ иногда ошибается, или, как говорят специалисты, выдает галлюцинации.

«Например, вместо ожидаемого текста на русском модель может что-то написать на китайском. Частный пример галлюцинаций — ошибки в фактических данных, некорректные адреса, числовые идентификаторы, гиперссылки. Наиболее мощные модели допускают не так много ошибок, как нам кажется, — в основном они связаны с различными точными сведениями из узких областей. Да, откровенные галлюцинации иногда помогают идентифицировать ботов, но это не универсальный метод. Передовые модели пишут очень убедительные тексты, ошибки в них не очевидны и потому с большим трудом распознаются человеком», — поясняет сотрудник международной лаборатории интеллектуальных систем и структурного анализа факультета компьютерных наук НИУ ВШЭ

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Биометрия без «дублера» незаконна Биометрия без «дублера» незаконна

Полным ходом идет внедрение биометрии. Однако, лишение свободы выбора незаконно

Монокль
Пифагор, или Теорема с одним неизвестным Пифагор, или Теорема с одним неизвестным

«Нет ни одной детали в жизни Пифагора, которая не была бы опровергнута»

Дилетант
Главное – остаться незамеченным Главное – остаться незамеченным

В чем состоит военная (а возможно, и не только) хитрость стелс-технологии?

Наука и техника
Ловушка для звёзд Ловушка для звёзд

У нас под ногами часто разбросаны сокровища, но мы их не замечаем

RR Люкс.Личности.Бизнес.
Конкурсы интересные Конкурсы интересные

Как развлекали себя и окружающих на банкете или празднестве в прошлом?

Вокруг света
Посвящено Беатриче Посвящено Беатриче

Данте обнаружил, осознал, как мало он знает

Наука и жизнь
Если кто-то подавился Если кто-то подавился

Как помочь человеку, если он подавился?

Здоровье
После зарплаты верну После зарплаты верну

Как правильно дать деньги в долг и что делать, когда их не отдают вовремя

Лиза
Дневник Дневник

Как ведение дневника помогает услышать себя? Личные истории наших героинь

Здоровье
Как получить максимум пользы для здоровья от велосипеда: 10 самых мудрых (и простых) правил Как получить максимум пользы для здоровья от велосипеда: 10 самых мудрых (и простых) правил

Десять универсальных законов, помогающих всем освоить велосипед

ТехИнсайдер
Оказалось, что большинство кошек предпочитают засыпать на левом боку — и ученые узнали, почему Оказалось, что большинство кошек предпочитают засыпать на левом боку — и ученые узнали, почему

Почему кошки перед сном чаще всего заваливаются на левый бок?

ТехИнсайдер
Андрей Борисов: Театр – это эссенция жизни, субстрат смыслов Андрей Борисов: Театр – это эссенция жизни, субстрат смыслов

Гендиректор МАМТа — о миссии театра, лидерстве и ценностях для нового поколения

Ведомости
Техно реализм Техно реализм

К чему ведут нас гаджеты и как революция в коммуникациях влияет на творчество

Правила жизни
На египетской картине нашли библейский синий На египетской картине нашли библейский синий

Из чего древние египтяне делали редкую краску — библейский синий

N+1
Многодетный капитал Многодетный капитал

Росту рождаемости помогут обновлённый маткапитал и сниженные ставки по ипотеке

Ведомости
«Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией «Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией

Истории женщин, которые научились жить с алопецией и помогают другим

Forbes
Пророческий мультсериал: 7 сбывшихся предсказаний из «Симпсонов» Пророческий мультсериал: 7 сбывшихся предсказаний из «Симпсонов»

Про 7 самых интересных предсказаний «Симпсонов», которые сбылись

ТехИнсайдер
«Сирены»: честная сатира с Джулианной Мур о драме богатых людей и семейных травмах «Сирены»: честная сатира с Джулианной Мур о драме богатых людей и семейных травмах

О новом шоу с Джулианной Мур рассказывает кинокритик Тамара Ходова

Forbes
Владимир Зворыкин Владимир Зворыкин

Правила жизни изобретателя Владимира Зворыкина

Правила жизни
Ученые превратили растительные отходы в топливо для самолетов Ученые превратили растительные отходы в топливо для самолетов

Технологию производства авиатоплива из биомассы создали в РГУ нефти и газа

ТехИнсайдер
Медвежий угол Медвежий угол

Как оргкомитет московской Олимпиады-80 зарабатывал – рубли и валюту

Ведомости
Как избежать ошибок на переговорах Как избежать ошибок на переговорах

Распространенные просчеты в оффлайн- и онлайн-переговорах и как их избежать

Inc.
Инфляция в белых халатах Инфляция в белых халатах

Медицинская инфляция может ускориться до 14% к концу года

Ведомости
Такой бал Такой бал

Как устроить бал выпускнику даже там, где это кажется невозможным

Новый очаг
Водородное движение Водородное движение

Можно ли использовать водород как альтернативный и экологичный вид топлива?

Y Magazine
Почему важно вовремя менять модель управления Почему важно вовремя менять модель управления

Как уметь в нужный момент менять управленческую модель

Forbes
«Тратить — очень круто»: как зумеры ведут себя с деньгами «Тратить — очень круто»: как зумеры ведут себя с деньгами

Как молодые взрослые ищут баланс между тратами и накоплениями

РБК
Превратить экранное время в деньги: как поколение альфа зарабатывает в смартфонах Превратить экранное время в деньги: как поколение альфа зарабатывает в смартфонах

Дети и подростки, которым исполняется около 15 лет, уже зарабатывают деньги

Forbes
Михаил Дегтярев: Фонд – это инструмент нашего президента Михаил Дегтярев: Фонд – это инструмент нашего президента

О создании Российского спортивного фонда и трудностях, которые он решит

Ведомости
Соучастники космоса Соучастники космоса

Как и зачем запускают совместные космические миссии? Рассказывает Натан Эйсмонт

Монокль
Открыть в приложении