Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Окаянный день Окаянный день

Это рассказ о том, как так случайно вышло, что у нас есть «День сурка»

Maxim
Победители и побеждённые Победители и побеждённые

Противоречивый мир Англии: норманны властвовали землей, а саксы её возделывали

Дилетант
Аналог ацтекского омичикауацтли из человеческой кости выявили среди находок из Техаса Аналог ацтекского омичикауацтли из человеческой кости выявили среди находок из Техаса

Какие ацтекские артефакты обнаружили на юге Техаса

N+1
Исследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессии Исследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессии

Секс один-два раза в неделю может принести наибольшую психологическую пользу

Inc.
Почему зевать — опасно? Узнайте интересные факты и мнение специалистов Почему зевать — опасно? Узнайте интересные факты и мнение специалистов

Почему сонливость и зевота — опасны?

ТехИнсайдер
Умер Зураб Церетели: вспоминаем 11 самых грандиозных и неоднозначных работ скульптора Умер Зураб Церетели: вспоминаем 11 самых грандиозных и неоднозначных работ скульптора

Самые яркие его шедевры художника-монументалиста Зураба Церетели

Maxim
В древнем левантийском поселении изготавливали пурпур на протяжении 500 лет В древнем левантийском поселении изготавливали пурпур на протяжении 500 лет

В Тель-Шикмоне примерно 500 лет находился крупный центр по производству пурпура

N+1
Жизнь по своему коду: как понять свою истинную природу и перестать подстраиваться Жизнь по своему коду: как понять свою истинную природу и перестать подстраиваться

Как достичь внутренней свободы и начать жить в согласии с собой

VOICE
Движение вверх Движение вверх

Почему современные мегаполисы должны делать ставку на вертикальный рост?

Ведомости
Как сохранить близость с детьми, даже когда они становятся взрослыми Как сохранить близость с детьми, даже когда они становятся взрослыми

Если вы хотите, чтобы ваши дети всегда доверяли вам, следуйте этим советам

Inc.
Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня? Культура сбережений: зачем откладывать на завтра то, что можно потратить сегодня?

Зачем каждому гражданину нужно выработать у себя привычку делать сбережения?

Наука и техника
Революция как массовый психоз? Революция как массовый психоз?

Учёный или шарлатан? Как разбирали труды Чижевского в 1940 году

Дилетант
Если на месте не сидится Если на месте не сидится

Все существа, начиная с самых первых, неустанно пытались обрести движение

Наука и жизнь
«Впервые играю героя, переполненного любовью» «Впервые играю героя, переполненного любовью»

Андрей Максимов — о Маяковском, театре и байопике «Лиля»

OK!
Как Мехран Насери из Ирана жил в аэропорту Парижа в течение 18 лет: история из фильма Как Мехран Насери из Ирана жил в аэропорту Парижа в течение 18 лет: история из фильма

История Мехрана Насери — иранца, который так и не смог покинуть зону ожидания

ТехИнсайдер
5 полезных устройств для тех, кто затеял ремонт 5 полезных устройств для тех, кто затеял ремонт

Подборка полезной и надежной техники для ремонта

CHIP
Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений Почему галактики закручиваются в спирали: ученые изучили механизмы формирования звездных скоплений

Какие модели образования спиралевидных галактик выделяют учены?

ТехИнсайдер
Яхонтовый интерес Яхонтовый интерес

История синего сапфира насчитывает в России не одно столетие

Grazia
Перовскитные солнечные элементы как перспективное направление зеленой энергетики Перовскитные солнечные элементы как перспективное направление зеленой энергетики

Как перовскитные солнечные элементы сделают энергетическую систему экологичнее?

Наука и техника
Ловушки для трендов: как вовремя услышать сигналы рынка Ловушки для трендов: как вовремя услышать сигналы рынка

Как бизнесменам научиться самим улавливать тренд-сигналы

Forbes
Начало неолита на северо-западе Южной Азии сдвинули примерно на три тысячи лет Начало неолита на северо-западе Южной Азии сдвинули примерно на три тысячи лет

Почему ученые пересмотрели хронологию поселения Мехргарх?

N+1
Зал ожиданий Зал ожиданий

Для психического здоровья фитнес даже полезнее, чем для физического

VOICE
Всё в цвету Всё в цвету

Обсудили с экспертом, как защитить чувствительную кожу в сезон пыльцы

Лиза
Как перестать повторять одни и те же ошибки: советы психолога Как перестать повторять одни и те же ошибки: советы психолога

Почему мы возвращаемся к старым ошибкам и как выйти из замкнутого круга?

VOICE
Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих

Почему из-за развития цифровых технологий снижаются когнитивные функции человека

Монокль
Полина Бондарева Полина Бондарева

Полина Бондарева о том, как прописать в квартире искусство и инсталляции

Собака.ru
Вселенная, возможно, вращается, но очень медленно Вселенная, возможно, вращается, но очень медленно

Как открытие вращения Вселенной может решить загадку «напряжения Хаббла»

ТехИнсайдер
Даниил Воробьев: «Урок» – это большой разговор с матерью через экран» Даниил Воробьев: «Урок» – это большой разговор с матерью через экран»

Даниил Воробьев о том, как «выгуливает» своих героев вне съемочной площадки

Ведомости
От проверки юрлица до отзывов: 13 шагов для выбора программы допобразования От проверки юрлица до отзывов: 13 шагов для выбора программы допобразования

О том, как избежать образовательных продуктов, которые не несут ценности

Forbes
Как утолить эмоциональный голод, если у вас нет партнера: 5 сфер, на которые стоит обратить внимание женщине Как утолить эмоциональный голод, если у вас нет партнера: 5 сфер, на которые стоит обратить внимание женщине

Одиночество — это не пустота, а пространство для наполнения своей жизни смыслами

Psychologies
Открыть в приложении