Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Лучшие анекдоты про Ленина и его любимую революцию Лучшие анекдоты про Ленина и его любимую революцию

Чтобы не забывать, где ты живешь и как ты здесь оказался

Maxim
Генетики обнаружили полиморфизм тоновости языка Генетики обнаружили полиморфизм тоновости языка

С помощью этого гена можно определить, относится ли язык человека к тоновым

N+1
Кристина Орбакайте: три героя её романа Кристина Орбакайте: три героя её романа

Дочери Примадонны удалось стать успешной артисткой и найти настоящую любовь

Cosmopolitan
Кровь стынет в жилах! 7 сериалов для тех, кому понравился «Колл-центр» Кровь стынет в жилах! 7 сериалов для тех, кому понравился «Колл-центр»

Что еще делать на карантине, как не смотреть сериалы

Cosmopolitan
Зумеры на бумере Зумеры на бумере

Василий Степанов о сериале «Мир! Дружба! Жвачка!»

Weekend
Она была студенткой, а он ее... учил? Она была студенткой, а он ее... учил?

Романы между студентами и преподавателями — очень плохая идея

Psychologies
Мир под их сапогом Мир под их сапогом

Как семейство Аньелли управляет миром

GQ
Заголовок на 43 млрд: как может развиваться история иска «Роснефти» к РБК Заголовок на 43 млрд: как может развиваться история иска «Роснефти» к РБК

«Роснефть» подала к РБК иск на рекордную сумму 43 млрд рублей

Forbes
Как сказать «нет» и не испортить отношения Как сказать «нет» и не испортить отношения

Как мягко, но эффективно защитить свои интересы?

Psychologies
35 простых правил жизни помогут сохранить окружающую среду 35 простых правил жизни помогут сохранить окружающую среду

Как быть социально и экологично ответственным человеком

GQ
Органическое окрашивание Органическое окрашивание

Почему бы не перейти от химических красителей к растительным?

Здоровье
«Слухи, образы, эмоции. Массовые настроения россиян в годы войны и революции» «Слухи, образы, эмоции. Массовые настроения россиян в годы войны и революции»

Отрывок из книги В. Аксенова: о крестьянах и их отношении к Первой мировой войне

N+1
Играет на равных Играет на равных

Кейт Бланшетт о том, как «Миссис Америка» может помочь избежать ошибок прошлого

Grazia
Окно в Париж Окно в Париж

Хозяйка квартиры на Патриарших прудах захотела создать дома парижскую атмосферу

AD
«Любовь во времена Zoom и чумы»: Esquire публикует диалог писателя с возлюбленной «Любовь во времена Zoom и чумы»: Esquire публикует диалог писателя с возлюбленной

Карантинный дневник Дмитрия Петровского

Esquire
«К северу от 38-й параллели» Андрея Ланькова «К северу от 38-й параллели» Андрея Ланькова

Книги: выбор Игоря Гулина

Weekend
«Мне хочется узнать себя» «Мне хочется узнать себя»

Зоя Бербер — о борьбе со стереотипами и новых проектах

OK!
Дмитрий Михайлов: Почему тема Великой Отечественной войны стала главной в культурной политике государства Дмитрий Михайлов: Почему тема Великой Отечественной войны стала главной в культурной политике государства

У обращения к теме Великой Отечественной войны есть своя политическая логика

СНОБ
Рассказ «Коконопряды» Теннесси Уильямса, который был опубликован в Esquire и лег в основу его последней пьесы Рассказ «Коконопряды» Теннесси Уильямса, который был опубликован в Esquire и лег в основу его последней пьесы

Рассказ «Коконопряды» Теннесси Уильямс написал в середине сороковых

Esquire
Дональд Гловер — Childish Gambino, сценарист, комик? 5 ипостасей артиста Дональд Гловер — Childish Gambino, сценарист, комик? 5 ипостасей артиста

Кто же такой этот Дональд Гловер?

Esquire
Как принять свои страх и злость: шпаргалка для родителей Как принять свои страх и злость: шпаргалка для родителей

Как научиться принимать свои чувства и сопереживать себе

Psychologies
Неудачные браки и внезапная смерть Олега Даля Неудачные браки и внезапная смерть Олега Даля

Подробности несчастной судьбы Олега Даля

Cosmopolitan
8 способов отбросить сожаления 8 способов отбросить сожаления

Стоит ли долго заниматься самобичеванием, совершив ошибку и навредив кому-то?

Psychologies
10 фильмов об одиноких мужчинах 10 фильмов об одиноких мужчинах

О важности и проблемах одиночества не однократно рассуждал кинематограф

GQ
24 общеупотребительных слова, которые на самом деле являются торговыми марками 24 общеупотребительных слова, которые на самом деле являются торговыми марками

История названий брендов, которые превратились в часть нашей повседневной жизни

Esquire
Программа на восстановление Программа на восстановление

Как восстановить потерянный бьюти-баланс?

Здоровье
9 модных тенденций прошлого, от которых умирали 9 модных тенденций прошлого, от которых умирали

Мода заразна, как чума, а иногда она была и так же смертельна

Maxim
Пересадка бороды: 6 ответов на главные вопросы Пересадка бороды: 6 ответов на главные вопросы

Рассказываем обо всех тонкостях пересадки бороды

Playboy
Как носить мужские сандалии? Вот 5 брендов, с которыми вы точно не ошибетесь Как носить мужские сандалии? Вот 5 брендов, с которыми вы точно не ошибетесь

5 проверенных обувных марок, которые делают отличные сандалии

Esquire
«Самые хрупкие в мире плечики»: эксклюзивная публикация писем Эдуарда Лимонова графине Елене Щаповой де Карли «Самые хрупкие в мире плечики»: эксклюзивная публикация писем Эдуарда Лимонова графине Елене Щаповой де Карли

Отрывки из писем Эдуарда Лимонова графине Елены Щаповой де Карли

Forbes
Открыть в приложении