Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Окаянный день Окаянный день

Это рассказ о том, как так случайно вышло, что у нас есть «День сурка»

Maxim
Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования Дискуссия о формате: почему российской рознице нужны единые стандарты регулирования

Государство хочет установить правила регулирования работы маркетплейсов

Forbes
7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться 7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться

Что такое законы психологии и как правильно их применять

VOICE
Какие были парфюмы в Древней Греции? Узнайте интересные факты! Какие были парфюмы в Древней Греции? Узнайте интересные факты!

Мир ароматов в Древней Греции был куда богаче, чем может показаться

ТехИнсайдер
Олег Липовецкий: Режиссер – это бог в пределах своих компетенций Олег Липовецкий: Режиссер – это бог в пределах своих компетенций

Олег Липовецкий рассказал, как руководящая должность сделала его мизантропом

Ведомости
Поднять ставки Поднять ставки

Высокие проценты по вкладам в банке: в чем подвох

Лиза
Какими бывают виды отверток и бит для шуруповертов Какими бывают виды отверток и бит для шуруповертов

Какие бывают отвертки — виды и названия наконечников, а также их размеры

CHIP
Запечатанный воздух Запечатанный воздух

Японские семейные тайны Сахалина

Weekend
У себя дома У себя дома

Современный европейский интерьер с арт-объектами

SALON-Interior
Территория детства Территория детства

7 особенностей дизайна, которые точно понравятся твоему ребенку

Лиза
Коллекция суеверий Коллекция суеверий

Угличский музей мистики Дарьи Чужой переосмысляет фольклор

Отдых в России
Мимоза Мимоза

Героиня рассказа Лены Бурковой учится находить радость в простых вещах

Grazia
Чудо-молекулы Чудо-молекулы

Зачем нашей коже нужны ниацинамид и эктоин

Лиза
Островский – революция в русском театре Островский – революция в русском театре

Гончаров, известный трилогией на букву «О», был интересным и метким критиком

Знание – сила
Тихоходкам набили татуировки электронным пучком Тихоходкам набили татуировки электронным пучком

Китайские материаловеды нанесли татуировки живым тихоходкам

N+1
Запутавшееся в кредите образование Запутавшееся в кредите образование

Почему кредит на образование недостаточно популярен среди студентов?

Ведомости
Рукопожатие крепкое Рукопожатие крепкое

Как развивается рынок высокотехнологичных протезов

Эксперт
Ловушки для трендов: как вовремя услышать сигналы рынка Ловушки для трендов: как вовремя услышать сигналы рынка

Как бизнесменам научиться самим улавливать тренд-сигналы

Forbes
Китайское техно Китайское техно

Краткая история технологического идеализма

ТехИнсайдер
Беспределы роста. Для избранных? Беспределы роста. Для избранных?

Как будет развиваться глобальная энергетика в ближайшую четверть века

Монокль
Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

Forbes
Волна долговых кризисов неизбежна Волна долговых кризисов неизбежна

Как институты развития могут работать в международных проектах

Эксперт
Инвесторы ловят дно Инвесторы ловят дно

Инвесторы ищут возможность заработать на падающем рынке

Ведомости
Четко по телу Четко по телу

Как «сбросить апельсиновую корку» с кожи?

Лиза
«Галилея археологов» «Галилея археологов»

Археологи давно борются с искушением перекопать поглубже всю Святую Землю

Знание – сила
11 пород собак, которых больше не существует 11 пород собак, которых больше не существует

11 примеров собак, которые больше не ходят по земле

ТехИнсайдер
Из ответственных рабочих — в мастера Из ответственных рабочих — в мастера

Как в условиях кадрового голода на рынке труда удержать работников?

Монокль
Жизнь застрахуют по долям Жизнь застрахуют по долям

Страховщики запускают продажи долевого страхования жизни

Деньги
Нестандартные страховки Нестандартные страховки

В страховом бизнесе развиты необычные полисы под нестандартные решения

Ведомости
Мастер игры. Андрей Аствацатуров — о слове и деле Набокова Мастер игры. Андрей Аствацатуров — о слове и деле Набокова

Владимир Набоков понимал все проблемы, стоящие перед литературой ХХ века

РБК
Открыть в приложении