Разделы
Материалы

Искусственный интеллект: нечеловеческие преимущества

Ольга Шевченко
Результаты работы ИИ в военных симуляциях демонстрируют потенциальные преимущества ИИ

Искусственный интеллект демонстрирует "инопланетные" возможности. Компьютер обучают так, что после этого ему не нужны данные о тактике человека. Они сами способны выбирать следующий ход и предугадывать действия людей, а также просчитывать десятки тысяч сценариев наперед.

ИИ-летчик истребителя победил опытного летчика-человека со счетом 15:0 в соревновании AlphaDogfight, проводимом Агентством передовых оборонных исследовательских проектов. При этом он не просто летал лучше человека – он сражался иначе. Агент ИИ компании Heron Systems использовал стрельбу из пушки в передней четверти, когда два самолета мчались навстречу друг другу лоб в лоб – такая стрельба запрещена при обучении летчиков из-за риска столкновения. Один из летчиков истребителя охарактеризовал способности ИИ как "сверхчеловеческие возможности", поскольку он совершал высокоточные выстрелы за доли секунды, которые "практически невозможны" для человека. Что еще более впечатляет, система ИИ не была запрограммирована на такой способ ведения боя. Она научилась этой тактике самостоятельно. Способность систем искусственного интеллекта не просто действовать лучше людей, но и сражаться по-другому, является их основным потенциальным преимуществом в войне.

Фокус перевел статью Пола Шарре о превосходстве ИИ над человеческими возможностями.

Наибольшего успеха в использовании преимуществ ИИ добьются те военные, которые смогут эффективно понять и использовать его уникальные и зачастую чуждые формы познания. Американские оборонные проекты иногда представляют себе системы ИИ как работу напарника или второго летчика. Однако системы ИИ часто мыслят принципиально иначе, чем люди. Эти различия могут стать преимуществом, но только в том случае, если военные понимают уникальные нечеловеческие сильные и слабые стороны ИИ. Американским военным следует увеличить инвестиции в прототипы, эксперименты и варгейминг с системами ИИ, чтобы лучше понять их потенциал в войне и лучшие способы их применения.

Искусственный интеллект. Отличия – это отлично

Результаты работы ИИ в военных симуляциях демонстрируют потенциальные преимущества ИИ в военных действиях и радикальные изменения, которые могут произойти в будущем. Во время знаменитой победы AlphaGo над Ли Седолем в китайской стратегической игре го ИИ сделал ход, настолько ошеломивший Ли, что он встал из-за стола и вышел из комнаты. AlphaGo рассчитала вероятность того, что человек сделал бы этот ход (на основе своей базы данных из 30 миллионов экспертных человеческих ходов), как 1 к 10 000. Ход AlphaGo был не просто лучше. Он был нечеловеческим.

Необычный ход AlphaGo – не случайность. AlphaGo играет иначе, чем человек, по нескольким параметрам. Он проводит несколько одновременных атак на разные участки доски, в то время как игроки-люди обычно сосредотачиваются на одном участке. Кроме того, AlphaGo разработал новые начальные ходы, в том числе такие, которые люди просто не понимают. Эксперты, изучающие стиль игры AlphaGo, описывают его как "инопланетный" и "из другого измерения".

Подобные нечеловеческие стили игры были замечены у агентов ИИ в различных играх. Система ИИ Libratus, достигшая сверхчеловеческих результатов в покере, играет иначе, чем опытные игроки. Она меняет тактику ставок эффективнее людей, делая необычно маленькие или необычно большие ставки, иногда в двадцать раз превышающие размер банка. "Она делит свои ставки на три, четыре, пять разных размеров, – рассказал Дэниел МакОлей (проигравший Libratus) журналу Wired. – Ни один человек не способен на такое".

Шахматные гроссмейстеры изучали ходы шахматного ИИ-агента AlphaZero, чтобы проанализировать его уникальный стиль игры. AlphaZero научился играть в шахматы полностью самостоятельно, без каких-либо данных из игр людей. По словам шахматных экспертов, он совершает "свирепые, неожиданные атаки" на короля противника. Он отдает предпочтение ходам, которые дают ему больше возможностей в будущем, и готов будет жертвовать шахматными фигурами на ранней стадии ради долгосрочного преимущества, включая жертвы, которые не приносят немедленной выгоды, но открывают позиции для атаки на короля противника. Этот ИИ особенно успешен в маневрах и комбинировании атак, используя и то, и другое так, что человеку трудно это воспроизвести.

AlphaZero научился играть в шахматы полностью самостоятельно, без каких-либо данных из игр людей. По словам шахматных экспертов, он совершает "свирепые, неожиданные атаки" на короля противника

Преимущества ИИ-агентов в играх указывают на их потенциал в военных действиях. Агенты ИИ в играх демонстрируют превосходство в точности, скорости, координации, ситуационной осведомленности, управлении ресурсами, агрессивности и рискованности по сравнению с игроками-людьми. Кумулятивный эффект этих преимуществ в играх не оставляет шанса противника. Эти качества также ценны в военных действиях. Однако у агентов ИИ есть и слабые стороны. Их производительность часто очень нестабильна, и агенты ИИ могут с трудом адаптироваться к небольшим изменениям правил в играх. Эти недостатки могут оказаться фатальными в бою, где нет правил, поэтому военным следует помнить о недостатках систем ИИ.

Новое стратегическое мышление, искусственный интеллект и Dota

Компьютерные игры, такие как StarCraft II и Dota 2, являются ценным полигоном для тестирования производительности ИИ. В этих играх противоборствующие стороны сражаются за контроль над территорией и ресурсами, при этом каждый игрок перемещает юнитов по цифровому полю боя для проведения разведки, сбора ресурсов и ведения боя. Хотя эти игры намного проще реального мира, они очень сложны по сравнению с другими играми. В любой момент времени в StarCraft II игрок может совершить любые действия. Поскольку часть информации скрыта, игроки взаимодействуют в динамичной и постоянно меняющейся среде с ограниченными знаниями. Компьютерные стратегические игры также требуют от агентов баланса между краткосрочной тактикой и долгосрочным планированием. В игре Dota 2 имеется около 20 тысяч временных отрезков, в течение которых игрок может сделать ход, что намного больше, чем примерно 80 ходов в шахматах или 150 ходов в игре го.

ИИ-агенты преуспели в компьютерных стратегических играх благодаря превосходному командованию и управлению

ИИ-агенты преуспели в компьютерных стратегических играх благодаря превосходному командованию и управлению. Игроки ИИ имеют доступ к той же информации, ресурсам и юнитам, что и люди. Их отдельные юниты имеют такую же скорость и способности. Любое преимущество обусловлено способностью агентов ИИ обрабатывать информацию, принимать решения и предпринимать действия. Победы ИИ-агентов демонстрируют, что машины могут значительно превосходить людей в командовании и управлении, что является потенциально важным преимуществом в войне.

Дело не только в том, что агенты ИИ быстрее – хотя они соображают намного быстрее даже лучших профессиональных геймеров. Не имея ограничений, агенты ИИ фактически непобедимы в тактике малых подразделений, способных уклоняться от огня противника в компьютерных играх. Даже будучи ограниченными человеческой скоростью, агенты ИИ лучше разбираются в тактике подразделений. Они также могут воспринимать больше информации одновременно, вместо того чтобы делить свое внимание на несколько задач. Они более точны и не тратят зря ценные действия, время или ресурсы. Кроме того, агенты ИИ могут атаковать с большей координацией между несколькими подразделениями или дружескими агентами.

Агенты OpenAI в игре Dota 2 под названием OpenAI Five продемонстрировали многие из этих качеств. Они были способны распознавать атаки игроков и отражать их быстрее, чем игроки успевали среагировать, даже при работе с 200-миллисекундной задержкой, призванной соответствовать времени реакции человека. Агенты OpenAI, представляющие собой отдельных членов команды, управляемых разными игроками ИИ, также смогли точно координировать свои атаки, поражая вражеские подразделения в нужный момент и с нужным количеством урона, не расходуя ресурсы. Благодаря своей скорости, точности и координации они особенно преуспели в командных боях, где несколько агентов совместно сражаются против нескольких противников. Кроме того, боты играли с необычной агрессивностью по сравнению с человеческими игроками, постоянно атакуя. Один из игроков-людей сказал: "Было ощущение, что на меня давят в каждый момент игры".

Хотя конкретные алгоритмы и тактики, используемые в шахматах, го, покере, StarCraft II или Dota 2, не могут быть применены в реальном бою, сверхчеловеческая скорость, осведомленность, точность, координация, просчитанный риск и агрессивность ИИ могут оказаться чрезвычайно ценными на поле боя. Военные, обучившие алгоритмы брать на себя функции командования и управления, потенциально могут деморализовать и обескуражить своих врагов, как это сделали агенты ИИ в компьютерных играх.

Повышение скорости и принуждение к ошибкам

В различных видах игр можно выделить несколько общих закономерностей, касающихся потенциальных преимуществ ИИ перед человеком. Первое, пожалуй, самое очевидное: увеличение скорости и масштабов обработки информации. В шахматах человеческие гроссмейстеры могут смотреть всего на 15-20 ходов вперед, в то время как AlphaZero может обрабатывать 60 тысяч позиций в секунду. В догфайтах, где важны доли секунды, агент ИИ не обременен медлительностью человеческого познания или рефлексов. В компьютерных играх по захвату флага агенты ИИ могут быстрее и точнее, чем люди, отмечать противников. В компьютерных стратегиях в реальном времени агенты ИИ выполняют задачи быстрее людей, включая несколько одновременных действий.

В шахматах человеческие гроссмейстеры могут смотреть всего на 15-20 ходов вперед, в то время как AlphaZero может обрабатывать 60 тысяч позиций в секунду
Фото: Sharie Kennedy/Getty Images

Агенты ИИ также могут более целостно рассматривать всю картину игры. В StarCraft II или Dota 2 агенту ИИ не нужно концентрировать свое внимание на отдельной части карты, где разворачивается бой, как это делает человек. Он может воспринимать информацию обо всей карте одновременно. Это дает агентам ИИ лучшую ориентацию и осведомленность о действиях в целом и способность оптимально распределять ресурсы. Агенты ИИ также демонстрируют внимательность к тем частям игры, которые в конкретный момент не участвуют в соревновании. Как агент для игры в шахматы AlphaZero, так и агент для игры в StarCraft II AlphaStar переставляли ненужные фигуры после атаки, вместо того чтобы ждать, пока их атакуют первыми.

Сверхчеловеческая внимательность агентов ИИ также проявляется в их способности не совершать небрежных промахов, которые характерны даже для искусной игры человека. Способность играть почти безупречно, даже если в некоторых обстоятельствах это невообразимо, может стать огромным преимуществом во многих играх, особенно если учесть, что игры разрабатываются так, чтобы в них было примерно равное соотношение сил между противоборствующими сторонами. После игры против AlphaStar профессиональный игрок StarCraft II Гжегож "MaNa" Коминч отметил: "Я понял, насколько сильно мой игровой процесс зависит от вынужденных ошибок и умения использовать человеческие реакции". Простое избегание неосторожных ошибок может стать серьезным преимуществом для агентов ИИ.

Еще одно преимущество – сверхчеловеческая точность, которая открывает новые стратегии, недоступные человеку – например, выстрелы из передней четверти в догфайте или идеально выверенные командные атаки в Dota 2. Сверхчеловеческая точность ИИ-агентов позволяет им действовать чрезвычайно результативно, сохраняя и распределяя ресурсы с оптимальной эффективностью. В стратегических играх, которые предполагают накопление ресурсов с течением времени, это может привести к значительным кумулятивным преимуществам.

Сверхчеловеческая точность ИИ-агентов позволяет им действовать чрезвычайно результативно, сохраняя и распределяя ресурсы с оптимальной эффективностью
Фото: Dota 2

Агенты ИИ также имеют значительные преимущества перед людьми в координации и долгосрочном планировании. В шахматах AlphaZero превосходит человека при комбинации нескольких атак. В Dota 2 агенты ИИ демонстрируют сверхчеловеческую координацию не только в тактических действиях, таких как атаки несколькими персонажами, но и в стратегических действиях. При игре в Dota 2 человеческие игроки, как правило, делят карту между товарищами по команде, а игроки лишь изредка меняются местами. Пять агентов ИИ OpenAI Five меняли местоположение своих персонажей на карте чаще, чем игроки-люди, гибко подстраиваясь под команду по ходу игры. В покере, го и шахматах агенты ИИ делают ходы, которые сначала кажутся слабыми, но в долгосрочной перспективе дают им позиционное преимущество. Однако это преимущество не всегда имеет место, и человеческие наблюдатели иногда критикуют агентов ИИ за очевидное отсутствие долгосрочного планирования.

Новые стратегии искусственного интеллекта

Во многих играх агенты ИИ расширили пространство доступных тактик и стратегий, демонстрируя больший диапазон поведения, чем человеческие игроки. Хотя новые стратегии агентов, играющих в шахматы и го, часто привлекают внимание, такое же поведение наблюдается и в других играх, включая покер и компьютерные игры. Профессиональный игрок в StarCraft II Дарио "TLO" Вюнш сказал об AlphaStar: "Агент продемонстрировал стратегии, о которых я раньше не думал, а это значит, что могут существовать новые способы игры, которые мы еще не до конца изучили". В некоторых случаях эта повышенная вариативность напрямую ведет к выигрышу, как в покере, где непредсказуемость является ключевым преимуществом. В других случаях она расширяет представления людей об игре – например, в шахматах, где AlphaZero заставил гроссмейстеров изучить новые дебюты.

AplhaStar vs TLO

Похоже, что агенты ИИ обладают способностью к резким изменениям в стратегии и риску, которые отличаются от игроков-людей, а в некоторых случаях не могут сравниться с ними. В покере Libratus может делать дикие изменения в размерах ставок. Как только AlphaGo получает уверенное преимущество в игре го, он начинает играть консервативно, поскольку его стратегия направлена на максимизацию своих шансов на победу, а не перевеса над другим игроком. Если AlphaGo лидирует, он будет играть консервативно, чтобы зафиксировать даже небольшой перевес, а не стремиться увеличить разрыв. Однако агенты ИИ не всегда играют осторожно. В шахматах AlphaZero будет жертвовать фигурами на ранней стадии игры, рискуя ради долгосрочного преимущества. В Dota 2 агенты OpenAI Five играют агрессивно, оказывая постоянное давление на игроков-людей и не ослабляя его ни на мгновение. Эти агенты также продемонстрировали способность к более тонко выверенному риску, чем человеческие игроки. Исследователи OpenAI отметили: "Человеческие игроки часто осторожничают, когда у их персонажа мало здоровья; OpenAI Five, похоже, очень тонко понимали, когда агрессивная атака персонажа с низким здоровьем стоит риска".

В целом, не похоже, что агенты ИИ играют более агрессивно или консервативно, чем люди. Скорее, они играют более стратегически и рационально (можно сказать, хладнокровно), регулируя степень агрессивности или осторожности в зависимости от того, что требуется в данный момент. В то время как человеческий игрок может иметь склонность к консервативному или агрессивному стилю игры, агенты ИИ, похоже, способны на обе крайности, быстро переключаясь между ними, исходя из того, что является оптимальным для достижения цели.

Агенты искусственного интеллекта не безупречны. В их слабостях также наблюдается нечто общее. Если в некоторых играх, таких как шахматы и го, они просто превосходят людей, то в компьютерных стратегиях в реальном времени открытая среда выявляет некоторые их недостатки. Одна из закономерных слабостей заключается в том, что агенты ИИ в играх StarCraft II и Dota 2 слишком полагаются на свои преимущества в тактике мелких подразделений в ущерб долгосрочному планированию. Системы ИИ часто становятся жертвами неоптимальных стратегий, если эти стратегии легче обнаружить. Победить более простыми способами легче, а агенты ИИ играют, чтобы победить.

Общая характерная черта ИИ также проявилась в некоторых играх. В покере человеческие игроки иногда находили части игрового дерева, которые Libratus не отобразил и не показал хороших результатов. (Исследователи, создавшие Libratus, быстро улучшили его производительность, выполняя вычисления в этих частях игрового дерева ночью, пока человеческие игроки спали). В одном матче по Dota 2 OpenAI позволил зрителям выбрать персонажей команды ИИ. Зрители выбрали плохой состав персонажей (плохая команда). Агенты ИИ действовали плохо и негибко, используя одну и ту же привычную тактику, которая плохо подходила для новых персонажей. В OpenAI Five также играли в ограниченном игровом пространстве, где определенные персонажи и типы действий были запрещены, чтобы уменьшить сложность игры. Окончательная версия OpenAI Five сыграла более 7 тысяч игр в Интернете, показав впечатляющий средний результат 99,4% побед против 15 тысяч игроков-людей. Однако модель оказалась не настолько надежной, как можно было предположить по этим цифрам. Каждый раз, когда разработчик обновлял игру Dota 2, например, добавлял новых персонажей, предметы или карты, исследователям OpenAI приходилось проводить так называемую "хирургическую операцию" над моделью ИИ, чтобы адаптировать ее к новым условиям. Аналогичную операцию приходилось проводить, если исследователи представляли модели новое действие или предмет, по мере того как они развивали возможности модели и знакомили ее с более сложными средами. Альтернативой этому относительно ручному инженерному процессу было переобучение новой модели полностью с нуля для новой игровой среды, что потребовало бы больших затрат времени и средств. Без значительной инженерной работы или переобучения модель с трудом адаптируется даже к незначительным изменениям. Эта хрупкость, вероятно, станет серьезным недостатком в реальных условиях, где пространство возможных действий противника является открытым, а среда не является сильно ограниченной и повторяемой, как в играх.

Заключение

В игровой среде некоторые преимущества агентов ИИ рассматриваются иначе, чем другие. Сверхчеловеческая точность и скорость часто рассматриваются как несправедливые преимущества. Тот факт, что ИИ-агент компании Heron Systems, участвующий в догфайтах, мог делать выстрелы, которые запрещены на тренировках летчиков-людей, может рассматриваться как несправедливое преимущество. В компьютерных играх программисты часто замедляют время реакции агентов ИИ, чтобы оно соответствовало человеческому. Однако все отмечают превосходные стратегические способности агентов ИИ, например, их мастерство в шахматах или го. Военные могут смотреть на эти преимущества по-другому. Война нечестна, и сверхчеловеческая скорость и точность, позволяющие повысить эффективность боевых действий, скорее всего, будут приветствоваться. И наоборот, принятие решений ИИ, которое является несколько загадочным, например, нестандартные ходы, которые иногда делают агенты ИИ в покере, шахматах и го, могут быть проблемой для военных. Военным легче довериться агенту ИИ, чьи преимущества (например, ускоренные рефлексы) четко определены. Довериться агенту ИИ, чьи познания непрозрачны, а долгосрочные планы неизвестны, может быть сложнее. Тем не менее, со временем, когда системы ИИ будут играть все большую роль, в том числе в тактическом планировании и принятии решений, военные командиры могут столкнуться с необходимостью принятия решения о том, стоит ли доверять рекомендациям системы ИИ, которые они не до конца понимают.

В условиях, когда системы ИИ должны сотрудничать с людьми, их инопланетное мышление может оказаться недостатком, и системы ИИ, возможно, придется специально обучать, чтобы они действовали как люди. В играх типа "Дипломатии", где требуется сотрудничество с игроками-людьми, агенты ИИ должны быть специально обучены на человеческих данных. Агенты ИИ, обученные только на основе самостоятельной игры, будут играть иначе, чем люди.

Поиск путей оптимального использования систем ИИ и их объединения с людьми в совместную человеко-машинную когнитивную систему станет непростой задачей. Системы ИИ иногда характеризуются в оборонных проектах как товарищи по команде, как будто они являются еще одним солдатом в отряде или вторым летчиком в кабине. Но человеко-машинные когнитивные команды принципиально отличаются от команд "человек-человек". Военные добавляют к своим боевым функциям систему обработки информации, которая может мыслить способами, совершенно чуждыми человеческому интеллекту. Вооруженные силы, которые лучше всего научатся сочетать человеческое и машинное познание и использовать необычные свойства мышления систем ИИ, получат огромные преимущества. Американские военные могут выиграть в грядущей войне, инвестируя в эксперименты, прототипы и варгейминг для изучения уникальных возможностей и проблем во взаимодействии человека и машины.

Об авторе

Пол Шарре – вице-президент и директор по исследованиям Центра новой американской безопасности. Эта статья взята из его новой книги Four Battlegrounds: Power in the Age of Artificial Intelligence.