Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Умные вещи века Умные вещи века

10 переизобретений, без которых ты раньше отлично жил, но теперь – не сможешь

Maxim
Преступные сети: как устроено современное браконьерство Преступные сети: как устроено современное браконьерство

Сотрудник береговой охраны о браконьерстве: почему оно выгодно всем

Esquire
Запретный маникюр: хозяйки салонов красоты об убытках из-за простоя, подпольной работе и ценах после пандемии Запретный маникюр: хозяйки салонов красоты об убытках из-за простоя, подпольной работе и ценах после пандемии

Основательницы салонов красоты рассказали, как они зарабатывают в изоляции

Forbes
Memento Vivere Memento Vivere

Фантастический рассказ о странном пациенте Крисе

Наука и жизнь
Питались солнцем и заманивали в секс-рабство: в каких сектах состояли звезды Питались солнцем и заманивали в секс-рабство: в каких сектах состояли звезды

Cреди известных актеров довольно часто встречаются сектанты

Cosmopolitan
Медицинские мифы и заблуждения, в которые верят даже врачи Медицинские мифы и заблуждения, в которые верят даже врачи

К сожалению, некоторые доктора частенько демонстрируют невежество

Популярная механика
Эоловы замки Тянь-Шаня Эоловы замки Тянь-Шаня

Путешествие в удивительные горы Тянь-Шаня

Наука и жизнь
Как менялся с годами образ Лады Дэнс — эволюция стиля главного секс-символа 90-х Как менялся с годами образ Лады Дэнс — эволюция стиля главного секс-символа 90-х

Как менялась с годами одна из самых ярких исполнительниц 90-х Лада Дэнс

Cosmopolitan
Время есть: чем планируют питаться люди после конца света Время есть: чем планируют питаться люди после конца света

Чем будут питаться выжившие американцы в Армагеддоне?

Esquire
Боевой раскрас? Как выглядят участницы реалити «Солдатки» на шоу и в жизни Боевой раскрас? Как выглядят участницы реалити «Солдатки» на шоу и в жизни

Героини реалити «Солдатки» рискнули всем, чтобы перевернуть свою жизнь

Cosmopolitan
Иван Грозный и его отряд дрессированных киллеров Иван Грозный и его отряд дрессированных киллеров

Опричники — грозные слуги Ивана Грозного

Maxim
Все не так и все не то: виновата «плохая» энергия? Все не так и все не то: виновата «плохая» энергия?

Негативная энергия может сказываться на здоровье

Psychologies
Словарик сериаломана. 15 слов, которые полезно знать каждому фанату сериалов Словарик сериаломана. 15 слов, которые полезно знать каждому фанату сериалов

Мечтают ли шоураннеры о синдикации процедуралов?

Maxim
Чем полезен чеснок для мужчин: 9 зачетных эффектов для твоего здоровья Чем полезен чеснок для мужчин: 9 зачетных эффектов для твоего здоровья

Настоящий суперпродукт!

Playboy
Кажется, я его не люблю... Кажется, я его не люблю...

Надо ли осуждать тех матерей, чьи чувства к детям «молчат»?

Лиза
Елизавета Боярская: «Сидеть дома с мужем и детьми – это счастье» Елизавета Боярская: «Сидеть дома с мужем и детьми – это счастье»

Прогулка по весеннему Петербургу с Елизаветой Боярской – чем не план на выходные

Grazia
«Театр онлайн — это как есть пластиковый огурец». Константин Богомолов снял сериал про карантин на карантине «Театр онлайн — это как есть пластиковый огурец». Константин Богомолов снял сериал про карантин на карантине

Константин Богомолов: о съемках на телефон и «пластмассовом» онлайн-театре

Forbes
Бодрящие факты о похмелье: действительно ли алкоголь обезвоживает? Бодрящие факты о похмелье: действительно ли алкоголь обезвоживает?

Алкоголь действует на организм несколько иначе, чем ученые предполагали

Популярная механика
А дома лучше? А дома лучше?

Вынужденный режим самоизоляции изменил в нашей жизни многое

Grazia
Чайки предпочли освоенные людьми районы Чайки предпочли освоенные людьми районы

Средиземноморские чайки приспособились к антропогенной среде

N+1
Разумную жизнь на двойниках Земли назвали редкостью Разумную жизнь на двойниках Земли назвали редкостью

На планетах, похожих на Землю, могут встречаться примитивные организмы

N+1
Гены устойчивости к жукам-вредителям помогут спасти ясень в Европе и Северной Америке Гены устойчивости к жукам-вредителям помогут спасти ясень в Европе и Северной Америке

Эти 53 гена позволяют азиатским ясеням бороться с изумрудной златкой

N+1
Клинт Иствуд: «Возьмитесь наконец за дело! Надерите кое-кому задницу» Клинт Иствуд: «Возьмитесь наконец за дело! Надерите кое-кому задницу»

Клинт Иствуд о правилах воспитания и ссыкливом поколении

Esquire
«Единственной правды о войне не существует» «Единственной правды о войне не существует»

Великая Отечественная война остается главным событием в сознании россиян

Огонёк
Скорее жив Скорее жив

Чем обернется для мира исчезновение Ким Чен Ына, если оно затянется

Огонёк
Гигантские искусственные атомы обменялись возбуждениями через волновод Гигантские искусственные атомы обменялись возбуждениями через волновод

Из сверхпроводящих кубитов можно создать два гигантских искусственных атома

N+1
Функциональные связи гиппокампа предсказали субъективный стресс Функциональные связи гиппокампа предсказали субъективный стресс

Гиппокамп для этого остался ключевым участком

N+1
Правая и левая антенны обеспечили муравьям память разной длительности Правая и левая антенны обеспечили муравьям память разной длительности

Какие отделы нервной системы муравьев ответственны за это, пока неизвестно

N+1
Месть Фиделя Кастро: почему мы ошибаемся в людях и доверяем лжецам Месть Фиделя Кастро: почему мы ошибаемся в людях и доверяем лжецам

Почему мы не понимаем, когда незнакомец врет нам в глаза

Forbes
Игра BioShock с годами становится только актуальнее Игра BioShock с годами становится только актуальнее

Все мы знаем, что такое глубокий экзистенциальный кризис и разочарование в мире

GQ
Открыть в приложении