Штучний інтелект демонструє "інопланетні" можливості. Комп'ютер навчають так, що після цього йому не потрібні дані про тактику людини. Вони самі здатні обирати наступний хід та передбачати дії людей, а також прораховувати десятки тисяч сценаріїв наперед.
Автор: Пол Шарре
Штучний інтелект-льотчик винищувача переміг досвідченого льотчика-людину з рахунком 15:0 у змаганні AlphaDogfight, яке проводять Агентство передових оборонних дослідницьких проєктів. Проте він не просто літав краще за людину – він бився інакше. Агент ШІ компанії Heron Systems стріляв із гармати в передній чверті, коли два літаки мчали назустріч один одному лоб в лоб – така стрільба заборонена під час навчання льотчиків через ризик зіткнення. Один із льотчиків винищувача охарактеризував здібності ШІ як "надлюдські можливості", оскільки він здійснював високоточні постріли за долі секунди, що "практично неможливо" для людини. Ще більш вражає, що система ШІ не була запрограмована на такий спосіб ведення бою. Вона навчилася цієї тактики самостійно. Здатність систем штучного інтелекту не просто діяти краще за людей, а й битися по-іншому, є їхньою основною потенційною перевагою у війні.
Фокус переклав статтю Пола Шарре про перевагу ШІ над людськими можливостями.
Найбільшого успіху у використанні переваг ШІ доб'ються ті військові, які зможуть ефективно зрозуміти й використати його унікальні та часто чужі форми пізнання. Американські оборонні проєкти іноді уявляють собі системи ШІ як роботу напарника або другого льотчика. Однак системи ШІ часто мислять принципово інакше, ніж люди. Ці відмінності можуть стати перевагою, але тільки в тому разі, якщо військові розуміють унікальні нелюдські сильні та слабкі сторони ШІ. Американським військовим слід збільшити інвестиції в прототипи, експерименти і варгеймінг із системами ШІ, щоб краще зрозуміти їхній потенціал у війні і найкращі способи їхнього застосування.
Відмінності – це відмінно
Результати роботи ШІ у військових симуляціях демонструють потенційні переваги ШІ у воєнних діях і кардинальні зміни, які можуть відбутися в майбутньому. Під час знаменитої перемоги AlphaGo над Лі Седолем у китайській стратегічній грі го АІ зробив хід, який так приголомшив Лі, що він підвівся з-за столу і вийшов з кімнати. AlphaGo розрахувала ймовірність того, що людина зробила б цей хід (на основі своєї бази даних із 30 мільйонів експертних людських ходів), як 1 до 10 тисяч. Хід AlphaGo був не просто кращим. Він був нелюдським.
Незвичайний хід AlphaGo – не випадковість. AlphaGo грає інакше, ніж людина, за кількома параметрами. Він проводить кілька одночасних атак на різні ділянки дошки, тоді як гравці-люди зазвичай зосереджуються на одній ділянці. Крім того, AlphaGo розробив нові початкові ходи, зокрема такі, які люди просто не розуміють. Експерти, які вивчають стиль гри AlphaGo, описують його як "інопланетний" і "з іншого виміру".
Подібні нелюдські стилі гри були помічені в агентів ШІ в різних іграх. Система ШІ Libratus, яка досягла надлюдських результатів у покері, грає інакше, ніж досвідчені гравці. Вона змінює тактику ставок ефективніше за людей, роблячи незвично маленькі або незвично великі ставки, які іноді в двадцять разів перевищують розмір банку. "Вона ділить свої ставки на три, чотири, п'ять різних розмірів, – розповів Деніел МакОлей (той, хто програв Libratus) журналу Wired. – Жодна людина не здатна на таке".
Шахові гросмейстери вивчали ходи шахового ШІ-агента AlphaZero, щоб проаналізувати його унікальний стиль гри. AlphaZero навчився грати в шахи повністю самостійно, без будь-яких даних з ігор людей. За словами шахових експертів, він здійснює "люті, несподівані атаки" на короля противника. Він віддає перевагу ходам, які дають йому більше можливостей у майбутньому, і готовий жертвувати шаховими фігурами на ранній стадії заради довгострокової переваги, включно з жертвами, які не приносять негайної вигоди, але відкривають позиції для атаки на короля противника. Цей ШІ особливо успішний у маневрах і комбінуванні атак, використовуючи їх так, що людині важко це відтворити.
Переваги ШІ-агентів в іграх вказують на їхній потенціал у воєнних діях. Агенти ШІ в іграх демонструють перевагу в точності, швидкості, координації, ситуаційній обізнаності, управлінні ресурсами, агресивності та ризикованості порівняно з гравцями-людьми. Кумулятивний ефект цих переваг в іграх не залишає шансу противнику. Ці якості також цінні у воєнних діях. Однак у агентів ШІ є і слабкі сторони. Їхня продуктивність часто дуже нестабільна, і агенти ШІ можуть насилу адаптуватися до невеликих змін правил в іграх. Ці недоліки можуть виявитися фатальними в бою, де немає правил, тому військовим слід пам'ятати про недоліки систем ШІ.
Нове стратегічне мислення
Комп'ютерні ігри, такі як StarCraft II і Dota 2, є цінним полігоном для тестування продуктивності ШІ. У цих іграх протиборчі сторони б'ються за контроль над територією і ресурсами, водночас кожен гравець переміщує юнітів по цифровому полю бою для проведення розвідки, збору ресурсів і ведення бою. Хоча ці ігри набагато простіші за реальний світ, вони дуже складні порівняно з іншими іграми. У будь-який момент часу в StarCraft II гравець може зробити приблизно дій. Оскільки частина інформації прихована, гравці взаємодіють у динамічному і постійно мінливому середовищі з обмеженими знаннями. Комп'ютерні стратегічні ігри також вимагають від агентів балансу між короткостроковою тактикою і довгостроковим плануванням. У грі Dota 2 є близько 20 тисяч часових відрізків, протягом яких гравець може зробити хід, що набагато більше, ніж приблизно 80 ходів у шахах або 150 ходів у грі го.
ШІ-агенти досягли успіху в комп'ютерних стратегічних іграх завдяки чудовому командуванню та управлінню. Гравці ШІ мають доступ до тієї самої інформації, ресурсів і юнітів, що й люди. Їхні окремі юніти мають таку саму швидкість і здібності. Будь-яка перевага зумовлена здатністю агентів ШІ опрацьовувати інформацію, ухвалювати рішення і вживати заходів. Перемоги ШІ-агентів демонструють, що машини можуть значно перевершувати людей у командуванні та управлінні, що є потенційно важливою перевагою у війні.
Річ не тільки в тому, що агенти ШІ швидші – хоча вони мислять набагато швидше за навіть найкращих професійних геймерів. Не маючи обмежень, агенти ШІ фактично непереможні в тактиці малих підрозділів, здатних ухилятися від вогню противника в комп'ютерних іграх. Навіть обмежені людською швидкістю, агенти ШІ краще розбираються в тактиці підрозділів. Вони також можуть сприймати більше інформації одночасно замість того, аби ділити свою увагу на кілька завдань. Вони точніші і не витрачають даремно цінні ходи, час або ресурси. Крім того, агенти ШІ можуть атакувати з більшою координацією між кількома підрозділами або дружніми агентами.
Агенти OpenAI в грі Dota 2 під назвою OpenAI Five продемонстрували багато з цих рис. Вони розпізнавали атаки гравців і відбивали їх швидше, ніж гравці встигали зреагувати, навіть під час роботи з 200-мілісекундною затримкою, яка покликана відповідати часу реакції людини. Агенти OpenAI, що є окремими членами команди, керованими різними гравцями ШІ, також змогли точно координувати свої атаки, вражаючи ворожі підрозділи в потрібний момент і з потрібною кількістю шкоди, не витрачаючи ресурсів. Завдяки своїй швидкості, точності та координації вони досягли неабиякого успіху в командних боях, де кілька агентів спільно борються проти кількох супротивників. Крім того, боти грали з незвичайною агресивністю порівняно з людськими гравцями, постійно атакуючи. Один із гравців-людей сказав: "Було відчуття, що на мене тиснуть у кожен момент гри".
Хоча конкретні алгоритми і тактики, що використовуються в шахах, го, покері, StarCraft II або Dota 2, незастосовні в реальному бою, надлюдська швидкість, поінформованість, точність, координація, прорахований ризик і агресивність ШІ можуть виявитися надзвичайно цінними на полі бою. Військові, які навчили алгоритми перебирати на себе функції командування та управління, потенційно можуть деморалізувати і збентежити своїх ворогів, як це зробили агенти ШІ в комп'ютерних іграх.
Збільшення швидкості та примус до помилок
У різних видах ігор можна виокремити кілька загальних закономірностей, що стосуються потенційних переваг ШІ над людиною. Перша, мабуть, найочевидніша: збільшення швидкості та масштабів обробки інформації. У шахах гросмейстери можуть дивитися всього на 15-20 ходів уперед, тоді як AlphaZero може обробляти 60 тисяч позицій на секунду. У догфайтах, де важливі частки секунди, агент ШІ не обтяжений повільністю людського пізнання або рефлексів. У комп'ютерних іграх із захоплення прапора агенти ШІ можуть швидше і точніше, ніж люди, позначати супротивників. У комп'ютерних стратегіях у реальному часі агенти ШІ виконують завдання швидше за людей, включно з кількома одночасними діями.
Агенти ШІ також можуть більш цілісно розглядати всю картину гри. У StarCraft II або Dota 2 агенту ШІ не потрібно концентрувати свою увагу на окремій частині карти, де розгортається бій, як це робить людина. Він може сприймати інформацію про всю карту одночасно. Це дає агентам ШІ кращу орієнтацію та обізнаність про дії загалом і здатність оптимально розподіляти ресурси. Агенти ШІ також демонструють уважність до тих частин гри, які в конкретний момент не беруть участі в боях. Як агент для гри в шахи AlphaZero, так і агент для гри в StarCraft II AlphaStar переставляли непотрібні фігури після атаки, замість того щоб чекати, поки їх атакують першими.
Надлюдська уважність агентів ШІ також проявляється в їхній здатності уникати промахів, які характерні навіть для майстерної гри людини. Здатність грати майже бездоганно, навіть якщо за деяких обставин це неймовірно, може стати величезною перевагою в багатьох іграх, особливо якщо врахувати, що ігри розробляють так, щоб у них було приблизно рівне співвідношення сил між сторонами, що протистоять. Після гри проти AlphaStar професійний гравець StarCraft II Ґжеґож "MaNa" Комінч зазначив: "Я зрозумів, наскільки сильно мій ігровий процес залежить від вимушених помилок і вміння використовувати людські реакції". Просте уникнення необережних помилок може стати серйозною перевагою для агентів ШІ.
Ще одна перевага – надлюдська точність, яка відкриває нові стратегії, недоступні людині – наприклад, постріли з передньої чверті в догфайті або ідеально вивірені командні атаки в Dota 2. Надлюдська точність ШІ-агентів дає їм змогу діяти надзвичайно результативно, зберігаючи та розподіляючи ресурси з оптимальною ефективністю. У стратегічних іграх, які передбачають накопичення ресурсів з плином часу, це може призвести до значних кумулятивних переваг.
Агенти ШІ також мають значні переваги над людьми в координації та довгостроковому плануванні. У шахах AlphaZero перевершує людину під час комбінації кількох атак. У Dota 2 агенти ШІ демонструють надлюдську координацію не тільки в тактиці, як-от атаки кількома персонажами, а й у стратегічних діях. Під час гри в Dota 2 людські гравці, як правило, ділять карту між товаришами по команді, а гравці лише зрідка міняються місцями. П'ять агентів ШІ OpenAI Five змінювали розташування своїх персонажів на карті частіше, ніж гравці-люди, гнучко підлаштовуючись під команду під час гри. У покері, го і шахах агенти ШІ роблять ходи, які спочатку здаються слабкими, але в довгостроковій перспективі дають їм позиційну перевагу. Однак ця перевага не завжди має місце, і спостерігачі іноді критикують агентів ШІ за очевидну відсутність довгострокового планування.
Нові стратегії
У багатьох іграх агенти ШІ розширили простір доступних тактик і стратегій, демонструючи більший діапазон поведінки, ніж гравці-люди. Хоча нові стратегії агентів, які грають у шахи та го, часто привертають увагу, така сама поведінка спостерігається і в інших іграх, включно з покером і комп'ютерними іграми. Професійний гравець у StarCraft II Даріо "TLO" Вюнш сказав про AlphaStar: "Агент продемонстрував стратегії, про які я раніше не думав, а це означає, що можуть існувати нові способи гри, які ми ще не до кінця вивчили". У деяких випадках ця підвищена варіативність безпосередньо веде до виграшу, як у покері, де непередбачуваність є ключовою перевагою. В інших випадках вона розширює уявлення людей про гру – наприклад, у шахах, де AlphaZero змусив гросмейстерів вивчити нові дебюти.
Схоже, що агенти ШІ мають здатність до різких змін у стратегії та ризику, які відрізняються від гравців-людей, а в деяких випадках не можуть зрівнятися з ними. У покері Libratus може робити дикі зміни в розмірах ставок. Щойно AlphaGo отримує впевнену перевагу в грі го, він починає грати консервативно, оскільки його стратегія спрямована на максимізацію своїх шансів на перемогу, а не переваги над іншим гравцем. Якщо AlphaGo лідирує, він гратиме консервативно, щоб зафіксувати навіть невелику перевагу, а не прагнутиме збільшити розрив. Однак агенти ШІ не завжди грають обережно. У шахах AlphaZero жертвуватиме фігурами на ранній стадії гри, ризикуючи заради довгострокової переваги. У Dota 2 агенти OpenAI Five грають агресивно, чинячи постійний тиск на гравців-людей і не послаблюючи його ні на мить. Ці агенти також продемонстрували здатність до більш тонко вивіреного ризику, ніж людські гравці. Дослідники OpenAI зазначили: "Людські гравці часто обережні, коли у їхнього персонажа мало здоров'я; OpenAI Five, схоже, дуже тонко розуміли, коли агресивна атака персонажа з низьким здоров'ям варта ризику".
Загалом, не схоже, що агенти ШІ грають більш агресивно або консервативно, ніж люди. Швидше, вони грають більш стратегічно і раціонально (можна сказати, холоднокровно), регулюючи ступінь агресивності або обережності залежно від того, що потрібно на даний момент. Тоді як людський гравець може мати схильність до консервативного або агресивного стилю гри, агенти ШІ, схоже, здатні на обидві крайнощі, швидко перемикаючись між ними, виходячи з того, що є оптимальним для досягнення мети.
Агенти штучного інтелекту не бездоганні. У їхніх слабкостях також спостерігається щось спільне. Якщо в деяких іграх, таких як шахи і го, вони просто перевершують людей, то в комп'ютерних стратегіях у реальному часі відкрите середовище виявляє деякі їхні недоліки. Одна із закономірних слабкостей полягає в тому, що агенти ШІ в іграх StarCraft II і Dota 2 занадто покладаються на свої переваги в тактиці дрібних підрозділів на шкоду довгостроковому плануванню. Системи ШІ часто стають жертвами неоптимальних стратегій, якщо ці стратегії легше виявити. Перемогти простішими способами легше, а агенти ШІ грають задля перемоги.
Загальна характерна риса ШІ також проявилася в деяких іграх. У покері людські гравці іноді знаходили частини ігрового дерева, які Libratus не відобразив і не показав хороших результатів. (Дослідники, які створили Libratus, швидко поліпшили його продуктивність, виконуючи обчислення в цих частинах ігрового дерева вночі, поки гравці-люди спали). В одному матчі з Dota 2 OpenAI дозволив глядачам вибрати персонажів команди ШІ. Глядачі обрали поганий склад персонажів (погану команду). Агенти ШІ діяли погано і негнучко, використовуючи одну й ту саму звичну тактику, яка погано підходила для нових персонажів. В OpenAI Five також грали в обмеженому ігровому просторі, де певні персонажі та типи дій були заборонені, щоб зменшити складність гри. Остаточна версія OpenAI Five зіграла понад 7 тисяч ігор в Інтернеті, показавши вражаючий середній результат 99,4% перемог проти 15 тисяч гравців-людей. Однак модель виявилася не настільки надійною, як можна було припустити за цими цифрами. Щоразу, коли розробник оновлював гру Dota 2, наприклад, додавав нових персонажів, предмети або карти, дослідникам OpenAI доводилося проводити так звану "хірургічну операцію" над моделлю ШІ, щоб адаптувати її до нових умов. Аналогічну операцію доводилося проводити, якщо дослідники представляли моделі нову дію або предмет, розвиваючи можливості моделі і знайомлячи її зі складними середовищами. Альтернативою цьому відносно ручному інженерному процесу було перенавчання нової моделі повністю з нуля для нового ігрового середовища, що вимагало б більших витрат часу і коштів. Без значної інженерної роботи або перенавчання модель насилу адаптується навіть до незначних змін. Ця нестабільність, імовірно, стане серйозним недоліком у реальних умовах, де простір можливих дій противника є відкритим, а середовище не настільки обмежене й повторюване, як в іграх.
Висновок
В ігровому середовищі деякі переваги агентів ШІ розглядаються інакше, ніж інші. Надлюдська точність і швидкість часто вважаються несправедливими перевагами. Той факт, що ШІ-агент компанії Heron Systems, який бере участь у догфайтах, міг робити постріли, заборонені на тренуваннях льотчиків-людей, може розглядатися як несправедлива перевага. У комп'ютерних іграх програмісти часто уповільнюють час реакції агентів ШІ, щоб він відповідав людському. Однак усі відзначають чудові стратегічні здібності агентів ШІ, наприклад, їхню майстерність у шахах або го. Військові можуть дивитися на ці переваги по-іншому. Війна нечесна, і надлюдська швидкість і точність, що дають змогу підвищити ефективність бойових дій, найімовірніше, вітатимуться. І навпаки, ухвалення рішень ШІ, яке є дещо загадковим, наприклад, нестандартні ходи, які іноді роблять агенти ШІ в покері, шахах і го, можуть бути проблемою для військових. Військовим легше довіритися агенту ШІ, чиї переваги (наприклад, прискорені рефлекси) чітко визначені. Довіритися агенту ШІ, чиє мислення непрозоре, а довгострокові плани невідомі, може бути складніше. Проте з часом, коли системи ШІ відіграватимуть дедалі більшу роль, зокрема в тактичному плануванні та ухваленні рішень, військові командири муситимуть ухвалювати рішення про те, чи варто довіряти рекомендаціям системи ШІ, які вони не до кінця розуміють.
В умовах, коли системи ШІ повинні співпрацювати з людьми, їхнє інопланетне мислення може виявитися недоліком, і системи ШІ, можливо, доведеться спеціально навчати, щоб вони діяли як люди. В іграх на кшталт "Дипломатії", де потрібна співпраця з гравцями-людьми, агенти ШІ мають спеціально навчатися на людських даних. Агенти ШІ, навчені тільки на основі самостійної гри, гратимуть інакше, ніж люди.
Пошук шляхів оптимального використання систем ШІ та їх об'єднання з людьми у спільну людино-машинну когнітивну систему стане непростим завданням. Системи ШІ іноді характеризуються в оборонних проєктах як товариші по команді, наче вони є ще одним солдатом у загоні або другим льотчиком. Але людино-машинні когнітивні команди принципово відрізняються від команд "людина-людина". Військові додають до своїх бойових функцій систему обробки інформації, яка може мислити способами, абсолютно чужими людському інтелекту. Збройні сили, які найкраще навчаться поєднувати людське і машинне пізнання та використовувати незвичайні властивості мислення систем ШІ, отримають величезні переваги. Американські військові можуть виграти в прийдешній війні, інвестуючи в експерименти, прототипи і варгеймінг для вивчення унікальних можливостей і проблем у взаємодії людини і машини.
Про автора
Пол Шарре – віцепрезидент і директор з досліджень Центру нової американської безпеки. Цю статтю взято з його нової книги Four Battlegrounds: Power in the Age of Artificial Intelligence.