Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

4 вредные привычки, которые, как подтверждают исследования, медленно разрушают здоровье 4 вредные привычки, которые, как подтверждают исследования, медленно разрушают здоровье

Привычки, которые могут стать смертельными, если их не контролировать

Inc.
Деменция в семье: как справиться с переменами — 5 правил Деменция в семье: как справиться с переменами — 5 правил

Как выдержать испытание деменцией, где найти силы, чтобы жить дальше?

Psychologies
Усадьбы, пляжи и дома творчества: идеи для отдыха в Москве и Подмосковье Усадьбы, пляжи и дома творчества: идеи для отдыха в Москве и Подмосковье

Что можно увидеть на маршрутах нового проекта «Москва + Подмосковье»

СНОБ

Почему Томас Андерс и Дитер Болен сцепились не на жизнь, а на смерть?

VOICE
Не только окрошка! 5 холодных супов в жару Не только окрошка! 5 холодных супов в жару

Минимум продуктов и потраченного времени, максимум пользы и вкуса

Maxim
«Бурят наудачу»: почему стартапы бросились искать запасы природного водорода «Бурят наудачу»: почему стартапы бросились искать запасы природного водорода

В мире могут существовать «астрономические» запасы «геологического» водорода

Forbes
Как стать королем пикника: топ-5 девайсов для идеального шашлыка Как стать королем пикника: топ-5 девайсов для идеального шашлыка

Учимся готовить шашлык с помощью высоких технологий

Maxim
И любимая подпись — «Ильич» И любимая подпись — «Ильич»

Маргарита Фофанова — одна из любимейших женщин Ленина

Дилетант
Вопрос психологу: как изучают психику, если ее не видно? Вопрос психологу: как изучают психику, если ее не видно?

Что мы знаем о мозге и какие знания можем использовать, а какие вопросы остаются

Правила жизни
«Люди умирали спокойно и публично»: какой была культура смерти в прошлом «Люди умирали спокойно и публично»: какой была культура смерти в прошлом

Глава из книги «Смерть в большом городе»

Psychologies
Найдены гены, связанные с посттравматическим стрессом и депрессией Найдены гены, связанные с посттравматическим стрессом и депрессией

Гены больного мозга работают совершенно не так, как у здорового

ТехИнсайдер
Вытащить с того света, спасти от чумы и принять роды: к чему должен быть готов экипаж воздушного судна Вытащить с того света, спасти от чумы и принять роды: к чему должен быть готов экипаж воздушного судна

Как и чем могут помочь бортпроводники:

ТехИнсайдер
Вредничает или болеет Вредничает или болеет

Почему животное не слушается, проявляет агрессию или метит территорию?

Лиза
«Муж на первом месте»: Михаил Галустян объяснил, почему запретил работать русской жене «Муж на первом месте»: Михаил Галустян объяснил, почему запретил работать русской жене

Михаил Галустян объяснил, почему его супруга не должна работать

VOICE
Лео Бокерия: «Я обожаю само слово «сердце» Лео Бокерия: «Я обожаю само слово «сердце»

Кардиохирург Лео Бокерия — одна из самых легендарных личностей в нашей медицине

Коллекция. Караван историй
Намагниченный взгляд Намагниченный взгляд

«Куда бегут собаки»: ошибки в электросхематической картине мира

Weekend
Что делать, если перещипала брови: 4 лучших выхода из ситуации Что делать, если перещипала брови: 4 лучших выхода из ситуации

Самые надежные и быстрые способы спасти свои брови после неудачной коррекции

VOICE
Многое теряют Многое теряют

Насколько безопасны новые инъекции для похудения?

VOICE
Дело тонкое Дело тонкое

Что надо знать российскому бизнесу при выходе на арабский рынок

Деньги
Бегство в одиночество. Как современные подростки строят отношения со сверстниками Бегство в одиночество. Как современные подростки строят отношения со сверстниками

Почему подростки с трудом выстраивают здоровую коммуникацию друг с другом?

СНОБ
От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки От итальянских рабочих до суперзвезд и инфлюенсеров: история белой майки

Откуда вообще взялась белая майка и при чем тут алкоголики и расизм

Правила жизни
6 навыков внутреннего ребенка, которые пригодятся каждому взрослому 6 навыков внутреннего ребенка, которые пригодятся каждому взрослому

Помните ли вы, как радовались простым вещам в раннем детстве?

Psychologies
От оскорблений до нападений: с чем сталкиваются женщины-политики От оскорблений до нападений: с чем сталкиваются женщины-политики

Женщины-политики чаще, чем мужчины, подвергаются оскорблениям и получают угрозы

Forbes
Бессмысленный и беспощадный: пятиминутный путеводитель по бунтам Бессмысленный и беспощадный: пятиминутный путеводитель по бунтам

Несколько бунтов разной степени успешности

Правила жизни
Как владелец стекольной империи в городе Гусь-Хрустальный построил Пушкинский музей Как владелец стекольной империи в городе Гусь-Хрустальный построил Пушкинский музей

Как возникла и развивалась династия предпринимателей и меценатов Мальцовых

Forbes
От Фаулза до Горбуновой: 7 главных книг лета От Фаулза до Горбуновой: 7 главных книг лета

Книги, за чтением которых время пролетит незаметно

РБК
«Измены мужа — ответственность жены»? 6 причин мужской неверности «Измены мужа — ответственность жены»? 6 причин мужской неверности

Как быть? Давайте для начала разберемся, почему мужчины изменяют

Psychologies
Не будущее, а всегда существующее Не будущее, а всегда существующее

Яков Чернихов как единственный в СССР создатель архитектурного абсолюта

Weekend
Одиночество вдвоем: почему отношения становятся несчастливыми Одиночество вдвоем: почему отношения становятся несчастливыми

Почему люди ощущают себя одинокими в паре?

Psychologies
Как мозг строит модели будущего и действует согласно этим моделям Как мозг строит модели будущего и действует согласно этим моделям

Память не только сохраняет воспоминания, но и позволяет прогнозировать будущее

ТехИнсайдер
Открыть в приложении