Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Эффект зловещей долины: как распознать дипфейк и не дать себя обмануть Эффект зловещей долины: как распознать дипфейк и не дать себя обмануть

Как не стать жертвой дипфейков и что делать, если вас уже обманули

Forbes
Мио-инозитол из грудного молока поспособствовал развитию мозга Мио-инозитол из грудного молока поспособствовал развитию мозга

Грудное молоко поспособствовало развитию мозга

N+1
Кто такой Генри Форд и как ему удалось построить автомобильную империю Кто такой Генри Форд и как ему удалось построить автомобильную империю

Человек, который стал не только символом автомобилизации, но и изменил мир

РБК
О феномене Мадонны и наследии Карла Лагерфельда. Заметки искусствоведа Изабель Грав О феномене Мадонны и наследии Карла Лагерфельда. Заметки искусствоведа Изабель Грав

«В другом мире. Заметки 2014-2017» — это сборник эссе искусствоведа и куратора

СНОБ
Астрономы впервые увидели, как рождаются газовые гиганты, подобные Юпитеру Астрономы впервые увидели, как рождаются газовые гиганты, подобные Юпитеру

Ученые смогли лучше понять процесс формирование огромных газовых гигантов

ТехИнсайдер
Лишние движения или апатия бездействия: как решать проблемы и не впадать в крайности Лишние движения или апатия бездействия: как решать проблемы и не впадать в крайности

Как найти золотую середину и понять, когда действия нужны, а когда нет

Forbes
Хотите вернуться к бывшему партнеру? Сначала ответьте на эти 9 вопросов Хотите вернуться к бывшему партнеру? Сначала ответьте на эти 9 вопросов

Вы случайно встретились после расставания и поняли, что чувства не угасли?

Psychologies
Альберт Эйнштейн: счастливые годы в Берне Альберт Эйнштейн: счастливые годы в Берне

С каким багажом Эйнштейн приехал в Берн и как он шел к своему «году чудес»

Наука и жизнь
Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет

Группа ученых повторно исследовала отпечатки ног древних людей

N+1
Принцесса и драконы: 7 теорий заговора вокруг гибели Дианы Спенсер Принцесса и драконы: 7 теорий заговора вокруг гибели Дианы Спенсер

Конспирологические теории смерти Дианы Спенсер

Правила жизни
Противоположность триггеров: что такое «искорки» и как они делают нашу жизнь лучше Противоположность триггеров: что такое «искорки» и как они делают нашу жизнь лучше

Что дарит нам, пусть и краткосрочные, но положительные ощущения?

Psychologies
У микобактерии лепры нашли новый антиген в клеточной стенке У микобактерии лепры нашли новый антиген в клеточной стенке

Ученые обнаружили в клеточной стенке микобактерии лепры фенольный гликолипид-II

N+1
Чем отличается пруд от озера: простое объяснение Чем отличается пруд от озера: простое объяснение

В чем отличие между прудом и озером, где лучше купаться?

ТехИнсайдер
Заметки отдыхающего: список дел, которые вы должны выполнить сразу же после заселения в отель Заметки отдыхающего: список дел, которые вы должны выполнить сразу же после заселения в отель

Сделайте эти 7 вещей, чтобы ваш отдых прошел максимально комфортно

ТехИнсайдер
Что общего между фольклором и стрит-артом. Отвечают современные художники Что общего между фольклором и стрит-артом. Отвечают современные художники

Как связаны между собой стрит-арт и фольклор?

СНОБ
Байки из люка Байки из люка

«Импостер»: очень предсказуемый триллер со смартфоном

Weekend
Действительно сильные женщины: как японки борются за право заниматься сумо Действительно сильные женщины: как японки борются за право заниматься сумо

Японки практиковали сумо в древности, и сегодня отстаивают свое право на него

Forbes
Видимо-невидимо: как женщины на работе прячут эмоции, усталость и собственное мнение Видимо-невидимо: как женщины на работе прячут эмоции, усталость и собственное мнение

Как устроен невидимый эмоциональный труд женщин

Forbes
Когда закончится музыка. Как жил и писал хиты Джим Моррисон Когда закончится музыка. Как жил и писал хиты Джим Моррисон

Как The Doors изменили мировую музыку

СНОБ
Фёдор Палицын: судьба генштабиста Фёдор Палицын: судьба генштабиста

Фёдор Палицын: современниками и потомками недооценён

Дилетант
Сколько лет, сколько ЗИМ Сколько лет, сколько ЗИМ

Автомобиль-конструктор с заводным механизмом из 50-х годов

Автопилот
Битый отбитого везет Битый отбитого везет

Юэль Киннаман и Николас Кейдж разыгрывают безнадежный сценарий

Weekend
«Сначала семья будет вас упрекать»: как во время декрета я стала кондитером и зарабатываю минимум 60 тысяч в месяц «Сначала семья будет вас упрекать»: как во время декрета я стала кондитером и зарабатываю минимум 60 тысяч в месяц

История Вари, которая в 30 лет сменила карьеру в моде на приготовление выпечки

VOICE
Самый большой вулкан в Солнечной системе когда-то был островом Самый большой вулкан в Солнечной системе когда-то был островом

Самый большой вулкан в Солнечной системе когда-то мог быть островом в море

ТехИнсайдер
Сколько платят за коммуналку в разных странах Сколько платят за коммуналку в разных странах

Экономия на коммунальных услугах — отдельный вид спорта

Maxim
Место в мире Место в мире

Чтобы найти свою планету в огромной Вселенной, нужно знать точный адрес

ТехИнсайдер
Видео с полицейским снизило риск неосторожного обращения с оружием среди детей Видео с полицейским снизило риск неосторожного обращения с оружием среди детей

Инструктаж снижает риск неосторожного обращения с оружием у детей

N+1
Сложно ли зарегистрировать бизнес в Дубае? И еще несколько задач, которые решала команда Wind Rises Сложно ли зарегистрировать бизнес в Дубае? И еще несколько задач, которые решала команда Wind Rises

Команда Wind Rises — о «легкой» регистрации и неработающих скидках

Правила жизни
Круглые, миндаль или щелки: как подобрать эффектный макияж по форме глаз — лайфхаки от эксперта Круглые, миндаль или щелки: как подобрать эффектный макияж по форме глаз — лайфхаки от эксперта

Форма глаз — аспект, на который стоит обращать внимание при выборе макияжа

VOICE
Бесконтактная оплата в магазинах: 7 способов, которые работают в России Бесконтактная оплата в магазинах: 7 способов, которые работают в России

Удобные способы оплаты телефоном в магазинах

CHIP
Открыть в приложении