Надлюдський розум усе ближче: як ШІ обігрує найкращих шахістів і майстрів покеру

Дослідники тестували SoG на шахах і покері
Фото: newscientist.com | Дослідники тестували SoG на шахах і покері

За словами творців, новий алгоритм Student of Games вчиться, граючи сам із собою, і може освоїти інші ігри.

Related video

Алгоритм Student of Games (SoG) від проєкту Google DeepMind на основі штучного інтелекту обігрує людей у шахи, покер та інші ігри, для перемоги в яких потрібні певні стратегії. Подробиці повідомляє сайт Newscientist.

Мартін Шмідт, який раніше працював у DeepMind, розповів, що в основі моделі Student of Games (SoG) лежать два більш ранні проєкти. Одним із них був DeepStack, алгоритм, який першим обіграв професійних гравців у покер. Другим був AlphaZero від DeepMind, який обігравав найкращих шахістів.

Різниця між двома згаданими моделями в тому, що одна орієнтована на ігри з неповними знаннями, як-от покер, де гравці не знають про ситуацію в конкурентів, іншу ж розробляли для таких ігор, як шахи, де обидва гравці завжди можуть бачити положення фігур. Алгоритми використовують принципово різні підходи, тому для проєкту DeepMind найняли всю команду DeepStack. За словами Шмідта, спочатку айтівці просто хотіли створити програму для вивчення ігор.

Дослідники тестували SoG на шахах, го, техаському холдемі та настільній грі під назвою "Скотленд-Ярд". З'ясувалося, що система може перемогти кілька наявних моделей ШІ та гравців. За словами розробника, система може освоїти й інші ігри, вона навчається, граючи проти самої себе.

"Коли ви граєте в таку гру як покер, складно зрозуміти, як же все-таки знайти найкращий стратегічний хід, не знаючи карти суперника, — пояснив Шмід. — Був певний набір ідей від AlphaZero та набір ідей від DeepStack, які вилилися у великий мікс ідей під назвою Student of Games".

Майкл Роватсос із Единбурзького університету, який не брав участі в дослідженні, все ж таки вважає, що, хоча це і вражає, треба буде пройти ще дуже довгий шлях, перш ніж новий ШІ-алгоритм можна буде вважати розумним загалом, тому що в іграх, на відміну від реальних умов, правила заздалегідь визначені.

Нагадаємо, що ШІ допоможе людям менше працювати без втрати зарплати. Автори дослідження з Autonomy підрахували, що у Великій Британії завдяки мовним моделям, таким як ChatGPT, у найближчі 10 років стане нормою чотириденний робочий тиждень.

Також повідомлялося, що Сем Альтман знову очолить OpenAIM — епопея з творцем ChatGPT завершилася.