У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

У ИИ есть много личностей, и некоторые из них злые и враждебные

Рекомендуемые статьи

Признаки хронического стресса, о которых ты вряд ли догадывалась

Взлета RPA можно ожидать на горизонте пяти лет

В районе ториевой аномалии на Луне располагается крупный гранитный массив

Правило шести рукопожатий подтвердили с помощью математической модели

Как сериалы создали образ новой маскулинности

Актрису возмутили предположения о том, что она сама виновата в домашнем насилии

Китай одним из первых вводит ограничения для развития ИИ

Состав дождя на других планетах может вас шокировать

Как погиб Джанни Версаче?

Команда археологов прочитала ДНК семи поколений семьи, жившей 6500 лет назад

Можно ли давать собакам кости, которые остаются после ужина?

Пытаясь подавлять мысли, мы оказываемся во власти «эффекта белого медведя»

Вы случайно встретились после расставания и поняли, что чувства не угасли?

Пакет с пакетами или банка из-под кофе с шурупами — своего рода культурный код

Нейросети могут генерировать проекты для бизнеса

Погружение в этимологию порой бывает очень увлекательным путешествием

Какую опасность могут представлять ноутбуки в аэропорту?

Как обрастала мифами история отношений России и Западных Балкан?

Почему нам постоянно нужны доказательства любви?

Самые известные секты, которые появились в XX веке: что в них общего?

В Линмере, Бедфордшир больше "монументальных" ям, чем где-либо еще в Англии

Зоологи описали пример того, как приматы взаимодействуют с телами сородичей

Что такое ложные воспоминания и как с ними помогают бороться иностранные языки?

Прекрасные дамы, которые активно участвовали в революции

История отношений независимых кинорежиссеров и сериальной индустрии

Подборка необычных занятий для тех, у кого мало времени на отпуск

Марии Кровавой приходилось долгие годы бороться за трон и за свою жизнь

Не так просто выбрать лучшую стиральную машину по соотношению цены и качества

Экстремальный вид голодания может помочь сбросить вес. Но есть нюансы

Слабый пароль — залог взлома и утечки информации!