Алгоритмические войны
Как битвы будущего видят по ту сторону океана
В конце прошлого года в Калифорнии состоялся полет самолета-шпиона U-2 ВВС США, который пилотировали совместно человек и искусственный интеллект. Это был первый в истории случай, когда ИИ – его назвали Artuμ – контролировал американскую военную машину. Что ж, сцены из «Звездных войн» стали гораздо ближе. Правда, странные буквы в имени нейросети отсылают не к далекой галактике, а к алгоритму μZero, разработанному компанией DeepMind.
Этот коммерческий алгоритм изначально создавался ради победы в шахматах и го, но ВВС США менее чем за пять недель научили его управлять радаром самолеташпиона. После миллиона тренировок в своем первом реальном полете в составе девятого разведывательного крыла Artuμ уже был не рядовым пилотом, а командиром миссии. Результаты полета оказались настолько многообещающими, что к следующему заданию Artuμ добавили функцию радиоэлектронной борьбы: вероятно, это умение понадобится ИИ в ближайшем будущем. Наверняка Р2-Д2 из «Звездных войн» тоже обладал навыками радиоэлектронного противодействия.
Началась эра алгоритмических войн, в которых важную роль будут играть коммерческие технологии и технологические стартапы.
Геймификация войны
Но каким образом стартап ускорил прогресс в военном деле? Где бы ни велись игры – на досках или компьютерах, – они идеальны для глубокого подкрепляющего обучения или обеспечения процесса, с помощью которого ИИ определяет правила неизвестных систем путем многократных проб и ошибок. Еще в 2010 году DeepMind начал обучать искусственный интеллект играть в старые видеоигры без доступа к базовому коду. К 2013 году его ИИ научился побеждать людей в Pong, а к 2020 году – в любой видеоигре Atari.
Пик карьеры DeepMind пришелся на 2016 год, когда AlphaGo, прапрапрадед алгоритма μZero, одолел действующего чемпиона мира по го, тем самым положив конец человеческому превосходству в стратегических играх. Значение этого события в компьютерной сфере можно сравнить с запуском первого спутника в области космических исследований.
Геймификация войны для компьютерных приложений не является чем-то новым. Например, такие игры, как Call of Duty, добились в этом немалых успехов. Но и реальные разведывательные операции U-2 мало чем отличаются: обнаружение вражеских целей – награда, пропущенные цели (или, что еще хуже, потерянный самолет) – наказание, законы физики – правила игры. Чтобы понять эту «игру», Artuμ пришлось проверить на собственном опыте все варианты, включая самые очевидные, – например, выяснить, не станет ли вражеская ПВО сбивать свои самолеты. Нет, не станет. Урок усвоен.
Однако игра против симулятора полезна лишь до известного предела. Чтобы в процессе обучения выработать варианты тактики, несвойственные человеку (как это получилось у программ семейства μZero в отношении стратегических игр), нужно, чтобы Artuμ начал воевать сам с собой. Правда, в отличие от настольной игры, противостояние в военной операции – например, противодействие разведке в условиях симулированного ракетного удара – требует особого алгоритма для уникальной схемы вознаграждения-наказания. В общем, «вражеского Artuμ» (C2-B5 для фанатов «Звездных войн»), чтобы потренировать ИИ перед его первым полетом, не было.