Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Мой трехлетка и то лучше нарисует!»: почему мы обесцениваем современное искусство «Мой трехлетка и то лучше нарисует!»: почему мы обесцениваем современное искусство

Почему нам сложно воспринимать «непонятное искусство»?

Psychologies
Мяч в кольце Мяч в кольце

Спортивные события второго года Великой Отечественной войны

Ведомости
Полина Бондарева Полина Бондарева

Полина Бондарева о том, как прописать в квартире искусство и инсталляции

Собака.ru
Я вас люблю Я вас люблю

Стоит ли признаваться в любви первой?

Лиза
Немедикаментозное снижение массы обрекло канадца на хроническую боль Немедикаментозное снижение массы обрекло канадца на хроническую боль

Почему может развиться хроническая боль на фоне снижения массы тела

N+1
Жизнь без конца Жизнь без конца

Как секс делает нас бессмертными

Men Today
Выстрел в финале пьесы Выстрел в финале пьесы

Кадровый дефицит в милиции: что говорят архивы и уголовные дела

Дилетант
В ритме сердца: что такое HRV и так ли он важен В ритме сердца: что такое HRV и так ли он важен

Разбираем все, что нужно знать о вариабельности сердечного ритма

РБК
Мимоза Мимоза

Героиня рассказа Лены Бурковой учится находить радость в простых вещах

Grazia
Женщина хочет крови: что такое femgore и как нас пугают безумными героинями в кино Женщина хочет крови: что такое femgore и как нас пугают безумными героинями в кино

Как под страшной маской femgore скрываются сатира и социальная критика

Forbes
Русско-американские отношения в XIX веке. Часть 2 Русско-американские отношения в XIX веке. Часть 2

Какими были отношения США и России накануне войны между Севером и Югом

Наука и техника
Космический буксир: мирный атом или ненаучная фантастика? Космический буксир: мирный атом или ненаучная фантастика?

Чем интересна перспектива использования ядерного двигателя в космосе?

Наука и техника
Рукопожатие крепкое Рукопожатие крепкое

Как развивается рынок высокотехнологичных протезов

Эксперт
Перекресток предубеждений Перекресток предубеждений

Пол не определяет ни компетентность, ни лидерский талант

Ведомости
Формула любви Александра Абдулова Формула любви Александра Абдулова

«Герой должен умереть молодым» — старая японская пословица. Он жил всего 54 года

Коллекция. Караван историй
В средневековом европейском борделе похоронили трехмесячного мальчика В средневековом европейском борделе похоронили трехмесячного мальчика

Ученые описали захоронение младенца в средневековом борделе Бельгии

N+1
Беззубый театр. Беседа на спорные темы Беззубый театр. Беседа на спорные темы

Продолжение статьи худрука Марка Розовского о современном театре

Знание – сила
Коллекция суеверий Коллекция суеверий

Угличский музей мистики Дарьи Чужой переосмысляет фольклор

Отдых в России
Индейка на взлете Индейка на взлете

Российское производство мяса индейки выросло почти на 4%

Агроинвестор
Бурялом Бурялом

Перед ним появилась огромная голова зверя с вытянутой мордой и острыми ушами...

Наука и жизнь
Мы идем своим путем Мы идем своим путем

Русская внешняя политика как культурное явление

Эксперт
Платеж за доверие Платеж за доверие

Рынок платежных агентов все больше консолидируется вокруг банков

Ведомости
«При загрузке видео на платформу происходит некая магия» «При загрузке видео на платформу происходит некая магия»

Сергей Косинский об искусственном интеллекте и будущем медиа

Деньги
Липецкий Клондайк Липецкий Клондайк

В Липецкой области создают уникальный кластер для любителей экстрима

Отдых в России
Энергия для Арктики Энергия для Арктики

Как в Арктике используют возобновляемую энергию и малые атомные электростанции

Ведомости
Сезон айс-латте начался, а полезно ли вообще пить холодный кофе? Спойлер: еще как! Сезон айс-латте начался, а полезно ли вообще пить холодный кофе? Спойлер: еще как!

О пользе обычного кофе известно немало, а что насчет пользы холодного напитка?

ТехИнсайдер
Коллеги, не ссорьтесь! Коллеги, не ссорьтесь!

Какие могут быть эффективные способы разрешения у разных рабочих конфликтов?

Лиза
Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец

Черные дыры могут быть не такими губительными для жизни, как предполагалось

Inc.
От «Больницы Питт» до «Терапии»: 8 лучших новых медицинских сериалов От «Больницы Питт» до «Терапии»: 8 лучших новых медицинских сериалов

Медицинские драмы переживают новую волну популярности! А вот их подборка

Forbes
3 бизнес-ошибки основателя фастфуд-сети Mary Wong 3 бизнес-ошибки основателя фастфуд-сети Mary Wong

Основатель Mary Wong — о шишках, которые набил в процессе развития фастфуд-сети

Inc.
Открыть в приложении