Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как менеджер паролей может предотвратить утечку информации Как менеджер паролей может предотвратить утечку информации

Всего один пароль - и не надо ломать голову над доступом к разным аккаунтам

CHIP
Под большим вопросом: почему Марк Твен не любил интервью (и журналистов) Под большим вопросом: почему Марк Твен не любил интервью (и журналистов)

Эссе Марка Твена, в котором автор обрушивает проклятия на все интервью

Esquire
Нательный датчик научили определять уровень витамина C через пот Нательный датчик научили определять уровень витамина C через пот

Это позволяет отслеживать уровень витамина после приема лекарств или еды

N+1
Африканские барабаны: быстрая связь на дальние расстояния Африканские барабаны: быстрая связь на дальние расстояния

В тот момент, когда мы заканчиваем произносить слово, его больше не существует

Популярная механика
3 упражнения, чтобы быстро снять эмоциональное напряжение 3 упражнения, чтобы быстро снять эмоциональное напряжение

Как справиться с напряжением, работая с телом у себя дома?

Psychologies
«Защищая Джейкоба»: на платформе AppleTV+ вышел семейный триллер с Крисом Эвансом «Защищая Джейкоба»: на платформе AppleTV+ вышел семейный триллер с Крисом Эвансом

На платформе AppleTV+ уже доступны первые эпизоды сериала «Защищая Джейкоба»

Forbes
Пещерных и современных львов сравнили волосок к волоску Пещерных и современных львов сравнили волосок к волоску

Исследователи сравнили структуру шерсти пещерных и современных львов

N+1
Почему вы переживаете из-за его бывшей и как это остановить Почему вы переживаете из-за его бывшей и как это остановить

Желание побольше узнать о бывшей девушке партнера вполне естественно

Psychologies
Исследование: 72% россиян считают, что главное предназначение женщины — быть матерью и хозяйкой. 40% уверены, что построить карьеру проще мужчинам Исследование: 72% россиян считают, что главное предназначение женщины — быть матерью и хозяйкой. 40% уверены, что построить карьеру проще мужчинам

Женщины в России зарабатывают на 28% меньше, чем мужчины на той же должности

Esquire
Что доводит до Киева. 100 лет советско-польской войне Что доводит до Киева. 100 лет советско-польской войне

Век назад на берегах Днепра завязывался узел, который мы развязываем до сих пор

СНОБ
Липосакция — это раз и навсегда? Самые распространённые мифы об операциях Липосакция — это раз и навсегда? Самые распространённые мифы об операциях

Пластическая хирургия постоянно обрастает огромным количеством слухов и мифов

Cosmopolitan
9 самых злых роботов кинематографа 9 самых злых роботов кинематографа

Роботы в кино — это настоящее воплощение зла

Популярная механика
«Пересекая границы» Майкла Дэвида-Фокса «Пересекая границы» Майкла Дэвида-Фокса

Майкл Дэвид-Фокс задается вопросом о советской модерности

Weekend
Фамильная ценность Фамильная ценность

Юная модель Стейнберг в самоизоляции времени даром не теряет

Vogue
Обнулились: 10 звезд, которые кардинально поменяли имидж Обнулились: 10 звезд, которые кардинально поменяли имидж

Звезды, которые прошли бьюти-перезагрузку

Cosmopolitan
Как изменится туризм после пандемии: 8 прогнозов от тревел-экспертов Как изменится туризм после пандемии: 8 прогнозов от тревел-экспертов

Когда-нибудь мы вновь отправимся путешествовать, но немного по-другому

Playboy
Кто боится Элизабет Мосс Кто боится Элизабет Мосс

Василий Корецкий о писательском хорроре «Ширли»

Weekend
Правила жизни Пирса Броснана Правила жизни Пирса Броснана

Пирс Броснан: актер, Дроэда, Ирландия, 67 лет

Esquire
Внимание, воздух! Внимание, воздух!

Можно ли улучшить состояние кожи и избавиться от лишнего веса с помощью дыхания

Tatler
Черную дыру около Солнца предложили искать роем спутников Черную дыру около Солнца предложили искать роем спутников

За поясом Койпера находится девятая планета или небольшая черная дыра

Популярная механика
«Мой телефон всегда включен. Я не разделяю личное и рабочее». Карьерные советы главы «Ренессанс страхование» «Мой телефон всегда включен. Я не разделяю личное и рабочее». Карьерные советы главы «Ренессанс страхование»

Генеральный директор «Ренессанс страхование» о том, как построить карьеру

Forbes
Вам стоит обратить внимание на бойца Петра Яна Вам стоит обратить внимание на бойца Петра Яна

Россиянин Петр Ян – сильный игрок в UFC

GQ
5 важных вопросов о косточке на стопе 5 важных вопросов о косточке на стопе

Можно ли избавиться от «косточки» на стопе раз и навсегда?

Лиза
Электрон в атоме гелия заменили на пион Электрон в атоме гелия заменили на пион

Физики впервые экспериментально подтвердили экзотический метастабильный атом

N+1
10 лучших боевиков за всю историю 10 лучших боевиков за всю историю

Самые шумные, влиятельные и сумасшедшие фильмы

Esquire
Операция «антикризис» Операция «антикризис»

Пять главных принципов финансовой безопасности семьи

Лиза
«Лимассолград»: FT рассказала, почему ЕС начал беспокоиться из-за русских на Кипре «Лимассолград»: FT рассказала, почему ЕС начал беспокоиться из-за русских на Кипре

Как выходцы из СССР повлияли на Кипр, почему это заставляет Брюссель волноваться

Forbes
Джозеф Стиглиц: Глобальное сотрудничество в 21 веке. Отрывок из книги Джозеф Стиглиц: Глобальное сотрудничество в 21 веке. Отрывок из книги

Почему Америка и другие страны прибывают в затяжном экономическом кризисе

СНОБ
Раскрыта загадка таинственных средневековых безлунных полнолуний Раскрыта загадка таинственных средневековых безлунных полнолуний

Загадочные восходы полной Луны над горизонтом с последующим ее исчезновением

Популярная механика
Что смотреть: вспоминаем все серии «Форсажа» от худшей к лучшей Что смотреть: вспоминаем все серии «Форсажа» от худшей к лучшей

«Форсаж» — главная киноэпопея XXI века для мальчиков

Maxim
Открыть в приложении