Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Древнеримские настолки Древнеримские настолки

Настольные игры были популярны с древности

N+1
Драгоценное время Драгоценное время

Мы вспомнили самые важные кинособытия минувших лет

Grazia
Как заинтересовать девушку в переписке? 9 беспроигрышных способов Как заинтересовать девушку в переписке? 9 беспроигрышных способов

Есть ли какая-то секретная формула, чтобы влюбить девушку по переписке?

Playboy
Музыка тёмной материи: можно ли услышать “песню” невидимой Вселенной Музыка тёмной материи: можно ли услышать “песню” невидимой Вселенной

Что особенного в темной материи?

Популярная механика
Замечания по адресу Замечания по адресу

Какую роль играет адрес в жизни человека, здания или учреждения

Forbes
Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года Колоссальная неопределенность: от чего зависит курс рубля и что с ним будет к концу года

От чего зависят валютные курсы, надолго ли доллар останется главной валютой мира

Forbes
Почему некоторые не боятся щекотки, а другие ее не переносят? Ответы на все вопросы Почему некоторые не боятся щекотки, а другие ее не переносят? Ответы на все вопросы

В чем секрет?

Playboy
Светлая полоса: фальшивый номер газеты Светлая полоса: фальшивый номер газеты

Как советские журналисты придумали способ обойти государственную цензуру

Esquire
Мордашову только спросить: миллиардер решил запустить медиа о здоровье Мордашову только спросить: миллиардер решил запустить медиа о здоровье

Алексей Мордашов намерен запустить медиа о медицине и здоровом образе жизни

Forbes
Карантин как повод для бунта Карантин как повод для бунта

В Российской империи попытки борьбы с эпидемиями могли быть для власти опасными

Дилетант
Сердце гребаного мира Сердце гребаного мира

Андрей Карташов о «Фее» Анны Меликян

Weekend
Переступить порог рейхстага Переступить порог рейхстага

История главного исторического здания Берлина

Наука и жизнь
Год без Победы. Как пандемия повлияет на память о войне Год без Победы. Как пандемия повлияет на память о войне

Впервые за два десятилетия, Красная площадь в Москве на 9 мая останется пустой

СНОБ
От дьяволицы до королевы: всё о прямолинейной и талантливой Кейт Бланшетт От дьяволицы до королевы: всё о прямолинейной и талантливой Кейт Бланшетт

Вспоминаем интересные детали биографии Кейт Бланшетт

Cosmopolitan
Lexus покоряет Байкал: лед, вода и медные трубы Lexus покоряет Байкал: лед, вода и медные трубы

Тест-драйв Lexus в экстремальных условиях

Maxim
Что там, в Что там, в

Проблемы первого года брака и как все это пережить

Cosmopolitan
Audi Q7 и Genesis G80 Audi Q7 и Genesis G80

Обновленный бестселлер от Audi и новый кроссовер от Genesis

Weekend
10 фильмов об одиноких мужчинах 10 фильмов об одиноких мужчинах

О важности и проблемах одиночества не однократно рассуждал кинематограф

GQ
«Польские земли под властью Петербурга: oт Венского конгресса до Первой мировой» «Польские земли под властью Петербурга: oт Венского конгресса до Первой мировой»

Варшава около 1900 года: гибель оккупированного города или рождение мегаполиса?

N+1
Промеж глаз: как устроены рогатки для профессионалов Промеж глаз: как устроены рогатки для профессионалов

Рогатка - одно из новых типов оружия, ведь резину человек освоил позже пороха

Популярная механика
Вы уволены. Как сохранить силу духа и почему аргумент «просто нет работы» не принимается Вы уволены. Как сохранить силу духа и почему аргумент «просто нет работы» не принимается

Какие ошибки не стоит совершать при поиске новой работы

Forbes
Как программист из Ульяновска построил бизнес на $100 млн, привлек инвестиции в США и стал героем фильма Дудя о Долине Как программист из Ульяновска построил бизнес на $100 млн, привлек инвестиции в США и стал героем фильма Дудя о Долине

Руслан Фазлыев к 40 годам создал два глобальных IT-бизнеса

Forbes
«Мы устали сидеть дома»: вернутся ли сотрудники в офисы после пандемии «Мы устали сидеть дома»: вернутся ли сотрудники в офисы после пандемии

Как будет происходить возвращение сотрудников в офисы

Forbes
Стул Филиппа Старка и столы из мусора: 5 примеров экологичного дизайна Стул Филиппа Старка и столы из мусора: 5 примеров экологичного дизайна

В умелых руках и мусор может стать объектом коллекционирования

РБК
Это семейное: братья и сёстры, ставшие знаменитыми Это семейное: братья и сёстры, ставшие знаменитыми

Какие братья и сёстры смогли добиться популярности в российском кино

Cosmopolitan
Закрома в ожидании засухи Закрома в ожидании засухи

С чем связана приостановка экспорта зерна и чего ждать дальше

Огонёк
Счастье после сорока. Сложный путь Ирины Гриневой Счастье после сорока. Сложный путь Ирины Гриневой

Как сложилась личная жизнь актрисы Ирины Гриневой

Cosmopolitan
Этна на ужин Этна на ужин

О рисовых котлетках, которые внушают доверие к опасному миру

Огонёк
Распад нейтрального B-мезона отклонился от прогнозов Стандартной модели Распад нейтрального B-мезона отклонился от прогнозов Стандартной модели

Самый точный анализ измерений распада B-мезона на детекторе LHCb

N+1
Последние китайские предупреждения: можно ли использовать опыт КНР для выхода из кризиса в торговле? Последние китайские предупреждения: можно ли использовать опыт КНР для выхода из кризиса в торговле?

Ретейл в Китае возвращается к жизни после карантинных ограничений

Forbes
Открыть в приложении