Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Без паники! Без паники!

Признаки хронического стресса, о которых ты вряд ли догадывалась

Лиза
Верить в бота: как локальное подразделение ММК вышло на внешний рынок Верить в бота: как локальное подразделение ММК вышло на внешний рынок

Взлета RPA можно ожидать на горизонте пяти лет

Forbes
Под ториевой аномалией на обратной стороны Луны заподозрили крупный гранитный массив Под ториевой аномалией на обратной стороны Луны заподозрили крупный гранитный массив

В районе ториевой аномалии на Луне располагается крупный гранитный массив

N+1
Почему людей на Земле связывают именно 6 рукопожатий? Математики МФТИ нашли ответ Почему людей на Земле связывают именно 6 рукопожатий? Математики МФТИ нашли ответ

Правило шести рукопожатий подтвердили с помощью математической модели

ТехИнсайдер
Мужчина, который не боится бояться Мужчина, который не боится бояться

Как сериалы создали образ новой маскулинности

Weekend
«Мною сильно манипулировали»: Кристина Асмус объяснила, почему не уходила от избивавшего ее мужчины «Мною сильно манипулировали»: Кристина Асмус объяснила, почему не уходила от избивавшего ее мужчины

Актрису возмутили предположения о том, что она сама виновата в домашнем насилии

VOICE
Дипфейки, репетиторы и запрещенные слова: как Китай планирует регулировать ИИ Дипфейки, репетиторы и запрещенные слова: как Китай планирует регулировать ИИ

Китай одним из первых вводит ограничения для развития ИИ

Forbes
Алмазный, стеклянный и каменный дожди: какие бывают осадки на других планетах Алмазный, стеклянный и каменный дожди: какие бывают осадки на других планетах

Состав дождя на других планетах может вас шокировать

ТехИнсайдер
Американская история преступления: теории заговора об убийстве Джанни Версаче Американская история преступления: теории заговора об убийстве Джанни Версаче

Как погиб Джанни Версаче?

Правила жизни
Прочитаны ДНК семи поколений одной семьи, жившей 6500 лет назад Прочитаны ДНК семи поколений одной семьи, жившей 6500 лет назад

Команда археологов прочитала ДНК семи поколений семьи, жившей 6500 лет назад

ТехИнсайдер
Вопрос, волнующий всех собачников: можно ли питомцу давать кости? Вопрос, волнующий всех собачников: можно ли питомцу давать кости?

Можно ли давать собакам кости, которые остаются после ужина?

ТехИнсайдер
«Не думайте о бывших»: «эффект белого медведя» — как действительно забыть о завершившихся отношениях «Не думайте о бывших»: «эффект белого медведя» — как действительно забыть о завершившихся отношениях

Пытаясь подавлять мысли, мы оказываемся во власти «эффекта белого медведя»

Psychologies
Хотите вернуться к бывшему партнеру? Сначала ответьте на эти 9 вопросов Хотите вернуться к бывшему партнеру? Сначала ответьте на эти 9 вопросов

Вы случайно встретились после расставания и поняли, что чувства не угасли?

Psychologies
Родом из СССР: 27 советских привычек, от которых мы до сих пор не можем избавиться Родом из СССР: 27 советских привычек, от которых мы до сих пор не можем избавиться

Пакет с пакетами или банка из-под кофе с шурупами — своего рода культурный код

Psychologies
Создаем логотип с помощью нейросетей: 7 полезных сервисов Создаем логотип с помощью нейросетей: 7 полезных сервисов

Нейросети могут генерировать проекты для бизнеса

CHIP
Откуда произошло слово Откуда произошло слово

Погружение в этимологию порой бывает очень увлекательным путешествием

ТехИнсайдер
Зачем нас заставляют доставать ноутбуки на досмотре в аэропорту? Зачем нас заставляют доставать ноутбуки на досмотре в аэропорту?

Какую опасность могут представлять ноутбуки в аэропорту?

ТехИнсайдер
Покровительница христианских народов: как Россия боролась за влияние на Балканах Покровительница христианских народов: как Россия боролась за влияние на Балканах

Как обрастала мифами история отношений России и Западных Балкан?

Forbes
«Если любишь, докажи!»: как перестать требовать этого от партнера — 3 сценария «Если любишь, докажи!»: как перестать требовать этого от партнера — 3 сценария

Почему нам постоянно нужны доказательства любви?

Psychologies
Раз, два, Чарли заберет тебя: гид по страшным культам XX века Раз, два, Чарли заберет тебя: гид по страшным культам XX века

Самые известные секты, которые появились в XX веке: что в них общего?

Правила жизни
Британские археологи поразились открытию 25 ям времен мезолита Британские археологи поразились открытию 25 ям времен мезолита

В Линмере, Бедфордшир больше "монументальных" ям, чем где-либо еще в Англии

ТехИнсайдер
Самка дрила два дня ухаживала за мертвым детенышем. А потом съела Самка дрила два дня ухаживала за мертвым детенышем. А потом съела

Зоологи описали пример того, как приматы взаимодействуют с телами сородичей

N+1
Все в школу! Иностранный язык может снизить количество ложных воспоминаний Все в школу! Иностранный язык может снизить количество ложных воспоминаний

Что такое ложные воспоминания и как с ними помогают бороться иностранные языки?

ТехИнсайдер
Комиссарши в пыльных шлемах Комиссарши в пыльных шлемах

Прекрасные дамы, которые активно участвовали в революции

Дилетант
Маленький экран, большие амбиции Маленький экран, большие амбиции

История отношений независимых кинорежиссеров и сериальной индустрии

Weekend
7 желаний, которые можно исполнить в одном месте 7 желаний, которые можно исполнить в одном месте

Подборка необычных занятий для тех, у кого мало времени на отпуск

СНОБ
Мария Кровавая: как дочь Екатерины Арагонской боролась за престол и правила Англией Мария Кровавая: как дочь Екатерины Арагонской боролась за престол и правила Англией

Марии Кровавой приходилось долгие годы бороться за трон и за свою жизнь

Forbes
Выбираем стиральную машину: на что смотреть, чтобы не потратить деньги зря Выбираем стиральную машину: на что смотреть, чтобы не потратить деньги зря

Не так просто выбрать лучшую стиральную машину по соотношению цены и качества

CHIP
Голодание на воде поможет сбросить лишний вес? Есть один важный нюанс Голодание на воде поможет сбросить лишний вес? Есть один важный нюанс

Экстремальный вид голодания может помочь сбросить вес. Но есть нюансы

ТехИнсайдер
Как создать надежный пароль, который не взломают хакеры? Как создать надежный пароль, который не взломают хакеры?

Слабый пароль — залог взлома и утечки информации!

Maxim
Открыть в приложении