Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кофе или матча? Ваш выбор по утрам многое о вас говорит Кофе или матча? Ваш выбор по утрам многое о вас говорит

Как оказалось, ваша привычка пить кофе или чай утром может многое рассказать вас

ТехИнсайдер
Новая экспедиция «Пангеи» Новая экспедиция «Пангеи»

Майк Хорн отправился в очередную кругосветку, чтобы оценить изменение климата

Y Magazine
Непотопляемая Вайолет: история единственной женщины, пережившей гибель «Титаника» и его двух братьев-близнецов Непотопляемая Вайолет: история единственной женщины, пережившей гибель «Титаника» и его двух братьев-близнецов

История Вайолет Джессоп больше похожа на сюжет фантастического блокбастера

ТехИнсайдер
Ранний завтрак может снизить риск развития диабета 2 типа Ранний завтрак может снизить риск развития диабета 2 типа

Ранний прием пищи может существенно снизить вероятность развития диабета 2 типа

ТехИнсайдер
Вы чересчур самокритичны? Задайте себе эти 7 вопросов Вы чересчур самокритичны? Задайте себе эти 7 вопросов

Семь вопросов, чтобы понять, почему вы так строги к самому себе

Psychologies
DRACO в космосе: зачем в NASA создают ядерный двигатель DRACO в космосе: зачем в NASA создают ядерный двигатель

Полмиллиарда долларов на создание космического корабля с ядерным двигателем

Forbes
Рабочей копии гена оказалось недостаточно для устранения врожденной цветовой слепоты Рабочей копии гена оказалось недостаточно для устранения врожденной цветовой слепоты

Рабочая копия гена CNGA3 не восстанавливает цветовое зрение

N+1
Почему людей на Земле связывают именно 6 рукопожатий? Математики МФТИ нашли ответ Почему людей на Земле связывают именно 6 рукопожатий? Математики МФТИ нашли ответ

Правило шести рукопожатий подтвердили с помощью математической модели

ТехИнсайдер
Пляжное тело: почему считается, что право надеть купальник нужно заслужить, — личный опыт и мнение психологов Пляжное тело: почему считается, что право надеть купальник нужно заслужить, — личный опыт и мнение психологов

Почему надеть бикини порой может быть непросто?

Psychologies
Инженеры укрыли электромобиль одеялом Инженеры укрыли электромобиль одеялом

Термопокрывало охладит электромобиль днем и согреет ночью

N+1
Баста, Рейнольдс, Портман и сэр Пол: кто из поп-звезд владеет спортивными клубами Баста, Рейнольдс, Портман и сэр Пол: кто из поп-звезд владеет спортивными клубами

Кто из селебрити вложился в спорт

Forbes
Поможем Африке — поможем себе Поможем Африке — поможем себе

Африка остается в сильнейшей зависимости от старых и новых колонизаторов

Эксперт
Как выглядят чародейки в 3 сезоне «Ведьмака»: теперь зрители ненавидят этот сериал Как выглядят чародейки в 3 сезоне «Ведьмака»: теперь зрители ненавидят этот сериал

Почему сериал «Ведьмак» получил сотни негативных отзывов?

VOICE
ТОП-10 самых горячих мест на Земле. В этих городах все еще живут люди! ТОП-10 самых горячих мест на Земле. В этих городах все еще живут люди!

Самые жаркие точки планеты: температура там поднимается выше 50°C

ТехИнсайдер
Уроки стартаповедения: о чем не стоит забывать тем, кто запускает свой проект Уроки стартаповедения: о чем не стоит забывать тем, кто запускает свой проект

Как удержать свой стартап на плаву и сделать его успешным?

Forbes
Похвала тупости Похвала тупости

Владимир Козин: скульптура с легким характером

Weekend
«Колония»: роман о жизни на маленьком ирландском острове «Колония»: роман о жизни на маленьком ирландском острове

Писательница рассказывает о жизни на маленьком ирландском острове

Forbes
Главред «Таких дел» Евгения Волункова — Forbes: «Происходит катастрофа — не паникуем» Главред «Таких дел» Евгения Волункова — Forbes: «Происходит катастрофа — не паникуем»

Интервью с главредом «Таких дел» Евгенией Волунковой

Forbes
Гана и другие: снова в долгах Гана и другие: снова в долгах

Как и 30 лет назад, неуправляемые долги африканских стран — это головная боль

Эксперт
Похожий на цветок розы мягкий манипулятор поможет собрать урожай Похожий на цветок розы мягкий манипулятор поможет собрать урожай

Инженеры из Японии и Вьетнама разработали мягкий манипулятор ROSE

N+1
От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки

Откуда вообще взялась белая майка и при чем тут алкоголики и расизм

Правила жизни
«Работа нашла меня сама»: как я за полгода стала разработчиком и техническим писателем «Работа нашла меня сама»: как я за полгода стала разработчиком и техническим писателем

Наталье было 32 года, когда она решила попробовать себя в абсолютно новой сфере

VOICE
Алкогольная депрессия: как распознать проблему — объяснение нарколога Алкогольная депрессия: как распознать проблему — объяснение нарколога

Тревожные звоночки, когда алкоголь высасывает радость, а не приносит её

Psychologies
Непохожие вербейники Непохожие вербейники

Посмотришь на вербейники, не можешь поверить их родству — насколько они различны

Наука и жизнь
Оазис в океане Оазис в океане

В чем причина успеха Benetti Oasis 34M?

Y Magazine
Я — сноб: актриса Наташа Бардо Я — сноб: актриса Наташа Бардо

Актриса Наташа Бардо — о том, что удивляет ее в людях больше всего

СНОБ
О желания до жалости: 5 компонентов любви — мнение философа О желания до жалости: 5 компонентов любви — мнение философа

Из чего состоит чувство любви?

Psychologies
Данте и Беатриче Данте и Беатриче

Рассматриваем картину британского художника Генри Холидея «Данте и Беатриче»

Дилетант
Так себе экономический рост: почему японские писательницы пишут о безысходности Так себе экономический рост: почему японские писательницы пишут о безысходности

Мрачная изнанка «роста благосостояния» Японии

Forbes
Узнайте цену! Подземный отель на глубине 400 метров предлагает «самый глубокий сон» Узнайте цену! Подземный отель на глубине 400 метров предлагает «самый глубокий сон»

Чтобы попасть в эту необычную гостиницу, придется преодолеть не одно препятствие

ТехИнсайдер
Открыть в приложении