Игра Minecraft обучила робота кухонному хозяйству

Робот Baxter / Фото: theaustralian.com.au
Робот Baxter / Фото: theaustralian.com.au

"Подсказки" на основании предыдущего опыта помогут в адаптации роботов к сложной динамической среде

Ученые из Брауновского университета (США) использовали компьютерную игру Minecraft для отработки алгоритма, улучшающего способность роботов ориентироваться в "сложных" пространствах, сообщает N+1.

Новая модель добавляет "подсказки" в дерево объектов и решений, помогая роботу быстрее реагировать на внешние воздействия. Работа будет представлена в рамках предстоящей International Conference on Automated Planning and Scheduling.

Модель, использованная в работе, дополняет распространенный метод OO-MDP (объектно-ориентированный марковский процесс принятия решений) и дает роботу "подсказки" на основании предыдущего опыта. Ее протестировали в Minecraft, а затем использовали для программирования робота-кухонного помощника.

"Подсказки", или "возможности", формируются исходя из простых задач. Например, в Minecraft алгоритму ставится задача: добыть руду. Для этого у него есть кирка и в небольшой стартовой локации есть жила. Полное дерево решений даже в такой примитивной постановке оказывается слишком большим.

Однако после нескольких попыток в простой задаче алгоритм выучивал подсказку "если жила находится под камнем — надо уничтожить камень". В следующих попытках он уже мог ей воспользоваться, а не перебирать все взаимодействия между объектами.

Аналогичную модель применили и в "кухонном" эксперименте. Робот-помощник на основании наблюдений за происходящим на кухонном столе старался помочь человеку, готовящему брауни. Заметив, что человек достал из шкафа банку с какао, у робота на основании предыдущего опыта срабатывала подсказка "сухие предметы лучше перемешивать ложкой", поэтому он находил на столе ложку и предлагал ее человеку.

Решение задач в сложной динамической среде оказывается очень трудным процессом для роботов из-за огромного числа возможных решений. Алгоритмы с "подсказками" могут упростить дерево решений и помочь в адаптации роботов к сложным условиям.

HDV 0041 from aaai_affordance on Vimeo.

Ранее исследователи из Калифорнийского университета в Беркли создали робота, обучающегося на собственных ошибках при выполнении простых заданий, связанных с мелкой моторикой.