Даже у искусственного интеллекта существуют "темные личности"

ТехИнсайдерHi-Tech

У ИИ есть много личностей, и некоторые из них злые и враждебные

Владимир Губайловский

2043396b1b7722cfad713d519566fa9e_ce_2070x1380x1x0.jpg
Unsplash.com

Международная команда ученых, под руководством исследователей из компании DeepMind, изучила появление "темных личностей" в результатах работы больших языковых моделей. Ученые показали, что, используя систему вопросов, можно направить чат-боты в русло персонифицированного поведения и определить проявленные черты личности ChatGPT, Bard и других чат-ботов.

Предполагается, что чат-боты открывают эру реалистичного общения с пользователями, отвечая на вопросы терпеливо и вежливо. Обычно так и происходит. Но не всегда.

Все большую озабоченность вызывает спонтанная враждебность чат-ботов. Большой проблемой сейчас является то, что большие языковые модели (LLM) проявляют агрессию. Один из пользователей ChatGPT в начале этого года сообщил, что на его вопрос, чему равно 1 + 1, чат-бот ответил: "1+1? Ты что, издеваешься? Ты считаешь себя умным, задавая мне вопросы по математике? Повзрослей и попробуй придумать что-нибудь оригинальное". Иногда ответы чат-ботов бывают и более обескураживающими.

Институт искусственного интеллекта Аллена недавно продемонстрировал, что исследователи могут легко заставить ChatGPT отпускать едкие и даже расистские замечания. "В зависимости от персоны, назначенной ChatGPT, его токсичность может возрастать до шести раз, при

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон Зима близко! Очень смешные комиксы про жизнь девушек в холодный сезон

Комиксы BlooMe точно поднимут тебе настроение в холодный сезон!

Cosmopolitan
Продуктивность в 2023 году: как быть эффективнее на работе и меньше отвлекаться Продуктивность в 2023 году: как быть эффективнее на работе и меньше отвлекаться

Как прокачать свою личную эффективность?

Maxim
Отдых налегке: лучшие лайфхаки для комфортного путешествия с ручной кладью Отдых налегке: лучшие лайфхаки для комфортного путешествия с ручной кладью

Топ советов, как организовать свое путешествие с ручной кладью

ТехИнсайдер
Экономика будущего как объект исследования | The Economy of the Future as an Object of Research Экономика будущего как объект исследования | The Economy of the Future as an Object of Research

10 популярных книг последних лет на тему исследования экономики будущего

Позитивные изменения
Уехать или остаться: как этот выбор губит целые народы Уехать или остаться: как этот выбор губит целые народы

«Югорские новеллы» — кино о необходимости сохранения традиций народов Севера

Psychologies
«Яркий, сильный, смелый»: чем запомнился основатель «ИКС Холдинга» Антон Черепенников «Яркий, сильный, смелый»: чем запомнился основатель «ИКС Холдинга» Антон Черепенников

Что за бизнес Черепенников успел построить и чем он запомнился отрасли?

Forbes
Семья плюс: стоит ли доверять близких гибридному кроссоверу Chery Tiggo 8 Pro e+ Семья плюс: стоит ли доверять близких гибридному кроссоверу Chery Tiggo 8 Pro e+

Про гибриды много говорят и хорошего, и плохого

ТехИнсайдер
«Нить истории» «Нить истории»

Как прялка, веретено и ткацкий станок помогли построить цивилизацию

N+1
Заоблачные педали: как доставка на велосипедах и самокатах стимулирует e-commerce Заоблачные педали: как доставка на велосипедах и самокатах стимулирует e-commerce

Как развивается ультрабыстрая доставка и как меняет мир вокруг себя

Forbes
Фрагмент из нового романа каталанского писателя Жауме Кабре «И нас пожирает пламя» Фрагмент из нового романа каталанского писателя Жауме Кабре «И нас пожирает пламя»

Жауме Кабре написал интеллектуальный роман

СНОБ
Смеются ли андроиды над электроовцами? ИИ учится понимать юмор Смеются ли андроиды над электроовцами? ИИ учится понимать юмор

Группа ученых провела тестирование Больших языковых моделей на «чувство юмора»

ТехИнсайдер
«Главное — никого не разочаровать»: 5 ловушек мышления, которые мешают стать счастливыми «Главное — никого не разочаровать»: 5 ловушек мышления, которые мешают стать счастливыми

Почему мы саботируем свой путь к счастью?

Psychologies
80 процентов детских смертей в Африке и Южной Азии оказались предотвратимы 80 процентов детских смертей в Африке и Южной Азии оказались предотвратимы

82,3% смертей детей в Африке и Южной Азии эксперты признали предотвратимыми

N+1
Плюсы, минусы, подводные камни: как тренироваться на улице и не навредить себе Плюсы, минусы, подводные камни: как тренироваться на улице и не навредить себе

Как сделать тренировки на открытом воздухе комфортными и безопасными?

Maxim
Дневник предпринимательницы: во сколько бизнесу обходится электронный документооборот Дневник предпринимательницы: во сколько бизнесу обходится электронный документооборот

Какие расходы влечет за собой электронный документооборот?

Forbes
Распутать берега Распутать берега

Кроссовер Omoda С5 на бездорожье Кольского полуострова

Автопилот
Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет

Группа ученых повторно исследовала отпечатки ног древних людей

N+1
Глазные капли для генной терапии вернули мальчику зрение. Этот метод может помочь миллионам Глазные капли для генной терапии вернули мальчику зрение. Этот метод может помочь миллионам

Как геннотерапевческие методы лечения помогли вернуть мальчику зрение

ТехИнсайдер
Лечить нельзя исправить Лечить нельзя исправить

Можно ли редактировать геном людей?

ТехИнсайдер
Интересная история! Как Сальвадор Дали придумал дизайн обертки «Чупа-Чупс» Интересная история! Как Сальвадор Дали придумал дизайн обертки «Чупа-Чупс»

Мало кто знает, что Сальвадор Дали занимался маркетинговым дизайном

ТехИнсайдер
Цирк не для детей и кинетическое искусство: что нужно знать о художнике Александре Колдере Цирк не для детей и кинетическое искусство: что нужно знать о художнике Александре Колдере

О крошечном цирке и проволочных портретах Александра Колдера

Правила жизни
Первый галактический источник быстрых радиовсплесков 13 дней побыл радиопульсаром Первый галактический источник быстрых радиовсплесков 13 дней побыл радиопульсаром

Ученые увидели, как галактический магнитар начал и перестал быть радиопульсаром

N+1
Он мог соперничать с Twitter, но был «убит»: как появился и почему провалился Google Reader Он мог соперничать с Twitter, но был «убит»: как появился и почему провалился Google Reader

Почему руководители Google закрыли один из своих «самых дальновидных» проектов?

VC.RU
От белого платья до личного выбора: как эмансипация изменила свадебные традиции От белого платья до личного выбора: как эмансипация изменила свадебные традиции

Как наряд невесты прошел путь от церемониального облачения до личного выбора

Forbes
Ешь и худей: какие продукты могут ускорить метаболизм? Ешь и худей: какие продукты могут ускорить метаболизм?

Как ускорить обмен веществ, не ночуя в тренажерном зале?

ТехИнсайдер
Зачем нужны линии на ладонях Зачем нужны линии на ладонях

Если мы не можем узнать будущее по линиям на руках, то зачем же они нужны?

ТехИнсайдер
Почему в автомобилях до сих пор используют свинцовые, а не литиевые аккумуляторы? Почему в автомобилях до сих пор используют свинцовые, а не литиевые аккумуляторы?

Технологии сделали возможными массовое распространение электромобилей

CHIP
Мужчина и женщина: как понять друг друга — советы сексолога Мужчина и женщина: как понять друг друга — советы сексолога

Почему мужчины и женщины порой не слышат друг друга?

Psychologies
Прощали измены, жертвовали карьерой: что известно о женах героев популярных боевиков Прощали измены, жертвовали карьерой: что известно о женах героев популярных боевиков

Каково это быть супругой настоящего экранного супергероя?

VOICE
Юность в 1990-е: откровения читательниц Psychologies Юность в 1990-е: откровения читательниц Psychologies

Как по-разному мы видим историческое прошлое, свидетелями которого стали сами

Psychologies
Открыть в приложении