Сверхчеловеческий разум все ближе: как ИИ обыгрывает лучших шахматистов и мастеров покера

Исследователи тестировали SoG на шахматах и покере
Фото: newscientist.com | Исследователи тестировали SoG на шахматах и покере

По словам создателей, новый алгоритма Student of Games учится, играя сам с собой, и может освоить другие игры.

Алгоритм Student of Games (SoG) от проекта Google DeepMind на основе искусственного интеллекта обыгрывает людей в шахматы, покер и другие игры, для победы в которых нужны определенные стратегии. Подробности сообщает сайт Newscientist.

Мартин Шмидт, прежде работавший в DeepMind, рассказал, что в основе модели Student of Games (SoG) лежат два более ранних проекта. Одним из них был DeepStack, алгоритм, который первым обыграл профессиональных игроков в покер. Вторым был AlphaZero от DeepMind, который обыгрывал лучших шахматистов.

Разница между двумя упомянутыми моделями в том, что одна ориентирована на игры с неполными знаниями, такими как покер, где игроки не знают о ситуации у конкурентов, другая же разрабатывалась для таких игр, как шахматы, где оба игрока всегда могут видеть положение фигур. Алгоритмы используют принципиально разные подходы, поэтому для проекта DeepMind наняла всю команду DeepStack. По словам Шмидта, поначалу айтишники просто хотели создать программу для изучения игр.

Исследователи тестировали SoG на шахматах, Го, Техасском холдеме и настольной игре под названием Скотланд-Ярд. Выяснилось, что система может победить несколько существующих моделей ИИ и игроков. По словам разработчика, система может освоить и другие игры, она обучается, играя против самой себя.

"Когда вы играете в такую игру, как покер, сложно понять, как же все-таки найти лучший стратегический ход, не зная карты соперника. — объяснил Шмид. — Был определенный набор идей от AlphaZero и набор идей от DeepStack, которые вылились в большой микс идей под названием Student of Games".

Майкл Роватсос из Эдинбургского университета, который не принимал участия в исследовании, все же считает, что, хотя это и впечатляет, предстоит пройти еще очень долгий путь, прежде чем новый ИИ-алгоритм можно будет считать разумным в целом, потому что в играх, в отличие от реальных условий, правила заранее определены.

Напомним, что ИИ поможет людям меньше работать без потери зарплаты. Авторы исследования из Autonomy подсчитали, что в Великобритании благодаря языковым моделям, таким как ChatGPT, в ближайшие 10 лет станет нормой четырехдневная рабочая неделя.

Также сообщалось, что Сэм Альтман снова возглавит OpenAIM, эпопея с создателем ChatGPT завершилась.