"Подсказки" на основании предыдущего опыта помогут в адаптации роботов к сложной динамической среде
Ученые из Брауновского университета (США) использовали компьютерную игру Minecraft для отработки алгоритма, улучшающего способность роботов ориентироваться в "сложных" пространствах, сообщает N+1.
Новая модель добавляет "подсказки" в дерево объектов и решений, помогая роботу быстрее реагировать на внешние воздействия. Работа будет представлена в рамках предстоящей International Conference on Automated Planning and Scheduling.
Модель, использованная в работе, дополняет распространенный метод OO-MDP (объектно-ориентированный марковский процесс принятия решений) и дает роботу "подсказки" на основании предыдущего опыта. Ее протестировали в Minecraft, а затем использовали для программирования робота-кухонного помощника.
- ЧИТАЙТЕ ТАКЖЕ: Ученые научили четвероногого робота прыгать
"Подсказки", или "возможности", формируются исходя из простых задач. Например, в Minecraft алгоритму ставится задача: добыть руду. Для этого у него есть кирка и в небольшой стартовой локации есть жила. Полное дерево решений даже в такой примитивной постановке оказывается слишком большим.
Однако после нескольких попыток в простой задаче алгоритм выучивал подсказку "если жила находится под камнем — надо уничтожить камень". В следующих попытках он уже мог ей воспользоваться, а не перебирать все взаимодействия между объектами.
Аналогичную модель применили и в "кухонном" эксперименте. Робот-помощник на основании наблюдений за происходящим на кухонном столе старался помочь человеку, готовящему брауни. Заметив, что человек достал из шкафа банку с какао, у робота на основании предыдущего опыта срабатывала подсказка "сухие предметы лучше перемешивать ложкой", поэтому он находил на столе ложку и предлагал ее человеку.
- СМОТРИТЕ ТАКЖЕ: Роботы-официанты работают в китайском ресторане
Решение задач в сложной динамической среде оказывается очень трудным процессом для роботов из-за огромного числа возможных решений. Алгоритмы с "подсказками" могут упростить дерево решений и помочь в адаптации роботов к сложным условиям.
HDV 0041 from aaai_affordance on Vimeo.
Ранее исследователи из Калифорнийского университета в Беркли создали робота, обучающегося на собственных ошибках при выполнении простых заданий, связанных с мелкой моторикой.