Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Лучшие анекдоты про Ленина и его любимую революцию Лучшие анекдоты про Ленина и его любимую революцию

Чтобы не забывать, где ты живешь и как ты здесь оказался

Maxim
Откуда берутся «Паразиты» Откуда берутся «Паразиты»

«Воспоминания об убийстве» — фильм, в котором есть ключи к картинам Пона Чжун-Хо

СНОБ
Юстиниан Великий и Великая чума Юстиниан Великий и Великая чума

Император, который мечтал о возрождении империи, но проиграл чумной палочке

Дилетант
Выход из самоизоляции: налаживаем режим дня Выход из самоизоляции: налаживаем режим дня

Что делать, чтобы появилась энергия структурировать свой день?

Psychologies
Литературный критик Анна Наринская — об «Анне Карениной», «Джейн Эйр» и книгах, которые она перечитывает Литературный критик Анна Наринская — об «Анне Карениной», «Джейн Эйр» и книгах, которые она перечитывает

Анна Наринская о книгах, которые манипулируют нашим сознанием

Esquire
Застенчивость ребенка — повод для беспокойства? Застенчивость ребенка — повод для беспокойства?

Застенчивость — патология или просто особенность личности?

Psychologies
Убить время: мобильные приложения, который займут вас надолго Убить время: мобильные приложения, который займут вас надолго

Занять время в четырёх стенах помогут мобильные приложения

Популярная механика
Моторная кора повторила запомненную информацию во время отдыха Моторная кора повторила запомненную информацию во время отдыха

Что выяснили с помощью инвазивного интерфейса в головном мозге

N+1
Еще 10 тайных сюрпризов в фильмах, которые ты мог не заметить Еще 10 тайных сюрпризов в фильмах, которые ты мог не заметить

Фильмы — старые, но пасхалки в них все еще смотрятся свежо

Maxim
Как встречаться с девушкой, которая одержима соцсетями: полезное руководство Как встречаться с девушкой, которая одержима соцсетями: полезное руководство

Мешают ли социальные сети вашим отношениям?

Playboy
Не буди зверя! 9 фраз, которые помогут избежать любого конфликта Не буди зверя! 9 фраз, которые помогут избежать любого конфликта

Эти фразы особенно актуальны на карантине, когда чувства и эмоции на пределе

Cosmopolitan
Как крупнейший производитель игрушек намерен снизить издержки с помощью картошки и кукурузы Как крупнейший производитель игрушек намерен снизить издержки с помощью картошки и кукурузы

Новое увлечение миллиардера Фрэнсиса Чой Чи-Мина — биопластик из крахмала

Forbes
Выхода нет: 4 самые неприступные тюрьмы мира Выхода нет: 4 самые неприступные тюрьмы мира

Тюрьмы супермаксимальной безопасности, из которых невозможно сбежать

Maxim
Фитнес без движения: как наш мозг сжигает много лишних калорий Фитнес без движения: как наш мозг сжигает много лишних калорий

Для сжигания калорий вовсе не обязательно пыхтеть на беговой дорожке

Популярная механика
Лётчица Женя Жигуленко: почему так хорошо быть длинноногой на войне Лётчица Женя Жигуленко: почему так хорошо быть длинноногой на войне

Евгения Жигуленко каждый день стремилась в небо, чтобы биться с врагом

Cosmopolitan
Питались солнцем и заманивали в секс-рабство: в каких сектах состояли звезды Питались солнцем и заманивали в секс-рабство: в каких сектах состояли звезды

Cреди известных актеров довольно часто встречаются сектанты

Cosmopolitan
Твой личный шедевр Твой личный шедевр

Микротатуировки: за и против

Cosmopolitan
Как на праздник: самые необычные профессии в мире Как на праздник: самые необычные профессии в мире

Резюме этих высококвалифицированных спецов скучными точно не назовешь

Популярная механика
Светлая полоса: фальшивый номер газеты Светлая полоса: фальшивый номер газеты

Как советские журналисты придумали способ обойти государственную цензуру

Esquire
Мария Гурьева: Новая эра образования — какой она будет? Мария Гурьева: Новая эра образования — какой она будет?

Вынужденная изоляция, закрытые школы и университеты перевернули мир образования

СНОБ
Почему они не говорили о войне Почему они не говорили о войне

Те, кто прошел Великую Отечественную войну, мало говорили о ней. Почему?

Psychologies
Как помойка станет парком Как помойка станет парком

Григорий Ревзин о городе будущего

Weekend
На что берут кредиты россияне с не очень высокой зарплатой: 8 реальных историй На что берут кредиты россияне с не очень высокой зарплатой: 8 реальных историй

Вещи, опрометчиво приобретенные в кредит гражданами с не очень высокой зарплатой

Esquire
Менеджеры паролей: что это такое и чем полезны? Менеджеры паролей: что это такое и чем полезны?

Надоело запоминать пароли к разным ресурсам?

CHIP
Антисептики: найти и обезвредить Антисептики: найти и обезвредить

Мы задали твои (и свои) вопросы проверенному эксперту относительно антисептиков

Cosmopolitan
«Влиять на цену акций могло все что угодно»: что говорят финансисты о рекордном иске «Роснефти» к РБК «Влиять на цену акций могло все что угодно»: что говорят финансисты о рекордном иске «Роснефти» к РБК

«Роснефти», подавшей иск к РБК на 43 млрд рублей, будет трудно доказать убытки

Forbes
Почему девочки мечтают о дне свадьбы? Почему девочки мечтают о дне свадьбы?

Лет с пяти некоторые девочки начинают планировать, какой будет их свадьба

Psychologies
Как выглядит математика: реальные воплощения абстрактных формул Как выглядит математика: реальные воплощения абстрактных формул

Художник, который превращает математические концепции в физические объекты

Популярная механика
«Брату-2» — 20 лет. Вспоминаем автомобили культового фильма «Брату-2» — 20 лет. Вспоминаем автомобили культового фильма

Автомобили, снявшиеся в одном из самых знаменитых российских фильмов

РБК
Пребывание на МКС странным образом влияет на микробиомы астронавтов Пребывание на МКС странным образом влияет на микробиомы астронавтов

Пребывание на МКС оставляет у космонавтов особый «микробный отпечаток»

Популярная механика
Открыть в приложении