Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пчелиный яд разрушил клетки агрессивного рака молочной железы Пчелиный яд разрушил клетки агрессивного рака молочной железы

Компонент пчелиного яда мелиттин разрушает опухоли

N+1
10 продуктов, снижающих «плохой» холестерин 10 продуктов, снижающих «плохой» холестерин

Эти суперфуды помогут справиться с повышенным уровнем холестерина

Cosmopolitan
Осиновый кол при низкой температуре Осиновый кол при низкой температуре

Роторный испаритель, который пришел на кухню из научных лабораторий

Bones
Как я провел это Как я провел это

Ксения Рождественская о фильме «Хорошего трипа»

Weekend
«Секстинг» и другие опасности: как подростков принуждают к сексу «Секстинг» и другие опасности: как подростков принуждают к сексу

Принуждение к сексу — проблема далеко не новая

Psychologies
Необходимость отвлекаться на электронную почту заставила людей грустить и злиться Необходимость отвлекаться на электронную почту заставила людей грустить и злиться

Необходимость отвлекаться во время выполнения задачи вызывает негативные эмоции

N+1
Что такое сильные решения и почему за риски полагается награда Что такое сильные решения и почему за риски полагается награда

Отрывок из книги о компаниях нового поколения —  «единорогах»

СНОБ
«Брату-2» — 20 лет. Вспоминаем автомобили культового фильма «Брату-2» — 20 лет. Вспоминаем автомобили культового фильма

Автомобили, снявшиеся в одном из самых знаменитых российских фильмов

РБК
Мать-и-мачеха? Медуница? И впрямь не узнать! Мать-и-мачеха? Медуница? И впрямь не узнать!

У этих растений весной и летом совершенно разное обличье

Наука и жизнь
Бог в овечьей шкуре Бог в овечьей шкуре

Андрей Карташов об антипатриархальном триллере «Приди ко мне»

Weekend
Пассивные агрессоры и как с ними справиться Пассивные агрессоры и как с ними справиться

Ужиться с партнером, склонным к пассивной агрессии, — испытание не из легких

Psychologies
Выживут только не роботы Выживут только не роботы

Что происходит с эмпатией в виртуальную эпоху

GQ
Микрочип: схема, изменившая мир Микрочип: схема, изменившая мир

Изобретения, которые значительно увеличили скорость технологического прогресса

Популярная механика
6 вредных финансовых привычек, которые портят тебе жизнь (и мешают разбогатеть) 6 вредных финансовых привычек, которые портят тебе жизнь (и мешают разбогатеть)

Истинные причины, почему деньги утекают сквозь пальцы

Playboy
Похороны Зевса. Послесловие к фильму Лозницы Похороны Зевса. Послесловие к фильму Лозницы

С какой стати фильм «Государственные похороны» стал одним из хитов интернета

СНОБ
Холли Робертс: Как иностранцу построить бизнес в России Холли Робертс: Как иностранцу построить бизнес в России

Иностранцы продолжают осваивать как малый, так и крупный бизнес в России

СНОБ
Не буди зверя! 9 фраз, которые помогут избежать любого конфликта Не буди зверя! 9 фраз, которые помогут избежать любого конфликта

Эти фразы особенно актуальны на карантине, когда чувства и эмоции на пределе

Cosmopolitan
Человеческий фактор Человеческий фактор

Большие модные Дома все чаще поддерживают камерные мастерские

Vogue
На перепутье: как безболезненно сменить профессию На перепутье: как безболезненно сменить профессию

Переход из одной специальности в другую затрагивает многие аспекты жизни

Psychologies
Запретный маникюр: хозяйки салонов красоты об убытках из-за простоя, подпольной работе и ценах после пандемии Запретный маникюр: хозяйки салонов красоты об убытках из-за простоя, подпольной работе и ценах после пандемии

Основательницы салонов красоты рассказали, как они зарабатывают в изоляции

Forbes
Моисей и все-все-все! Кто такие евреи и почему о них все время говорят? Моисей и все-все-все! Кто такие евреи и почему о них все время говорят?

Разбираемся в том, почему еврейский вопрос всегда актуален

Maxim
Играет на равных Играет на равных

Кейт Бланшетт о том, как «Миссис Америка» может помочь избежать ошибок прошлого

Grazia
«Всё, что я делаю, может быть ошибкой»: почему миллиардер Тоби Лютке советует видеоигры и мягкое отношение к критике «Всё, что я делаю, может быть ошибкой»: почему миллиардер Тоби Лютке советует видеоигры и мягкое отношение к критике

Глава Shopify о ментальных установках, которые помогут развить карьеру и бизнес

VC.RU
Как быть, если карантин убивает ваши отношения? Как быть, если карантин убивает ваши отношения?

Способы, которые помогут наладить ваши отношения

GQ
Jaguar I-PACE. Идеальная модель Греты Тунберг Jaguar I-PACE. Идеальная модель Греты Тунберг

Дорогая Грета, твои выступления оставили глубокий след в наших сердцах

4x4 Club
Борис Зарьков: «Креативить могут только свободные люди» Борис Зарьков: «Креативить могут только свободные люди»

Как превратить шефа в звезду мирового уровня?

Bones
Алкогений: Уинстон Черчилль Алкогений: Уинстон Черчилль

Жизнь Черчилля — редкий пример счастливого и мирного алкоголизма

Maxim
Танцевальные тренировки по видео: хип-хоп, табата, зумба и другие Танцевальные тренировки по видео: хип-хоп, табата, зумба и другие

Как разные танцевальные стили приспособили под тренировки

Psychologies
Фитнес без движения: как наш мозг сжигает много лишних калорий Фитнес без движения: как наш мозг сжигает много лишних калорий

Для сжигания калорий вовсе не обязательно пыхтеть на беговой дорожке

Популярная механика
Почему нам нужно больше «милоты» Почему нам нужно больше «милоты»

Любоваться котятами и щенками — не только нормально, но и полезно!

Psychologies
Открыть в приложении