AI 机器人学会玩积木游戏
- 研究人员开发了一种机械臂,可以使用触觉和视觉来学习叠叠乐游戏。
- 在这项工作中开发的机器学习方法可以帮助机器人组装消费产品,并执行其他需要仔细物理交互的任务。
Jenga 是一款复杂的游戏,需要精确的眼手协调和策略。作为人类,我们无缝地整合我们的视觉和触觉来掌握这个游戏。另一方面,机器人尚不具备这种复杂程度。
大多数机器人学习系统只使用视觉数据,没有触觉,这基本上限制了他们了解外部世界的能力。基于无模型强化学习技术的现有学习算法几乎没有能力利用有关物理对象、接触或力的知识。
最近,麻省理工学院 MCube 实验室的研究人员开发了一种算法来使用机器人复制这种能力。与使用大量数据集来评估下一步最佳动作的传统机器学习技术不同,该机器人学习并利用分层模型,能够温和而精确地提取碎片。
玩积木的机器人
该机器人配备了外部 RGB 摄像头、软爪抓手和力感应腕带。所有这些组件都使机器人能够观察和感受积木塔及其各个块。
研究人员定制了工业 ABB IRB 120 机械臂,并在其触手可及的地方设置了一个叠叠塔。当手臂轻轻推向一个积木时,计算机会从其袖带和摄像头捕捉触觉和视觉反馈,并将这些测量结果与机器人之前的动作进行比较。
参考:ScienceRobotics | doi:10.1126/scirobotics.aav3123 |麻省理工学院
该模型使机器人能够准确估计棋子的状态,模拟下一个可能的动作,并决定一个有利的动作。机器实时学习是继续推动块还是移动到新块,以防止结构坍塌。
这比为国际象棋或围棋开发 AI 更具挑战性,因为 Jenga 游戏需要基本的身体技能,例如拉、推、放置和对齐单个块。
在这项工作中开发的机器人有效地识别出一个块何时被卡住或自由,并决定如何使用更少的数据来提取它。它经过近 300 次尝试(而不是数万次尝试)的训练。类似结果和测量的尝试被分组在集群中,每个集群代表特定的块行为。
对于每个单个数据集群,机器开发了一个模型来估计一个块的行为,给定其当前的触觉和视觉测量值。这种受人类学习自然方式启发的聚类策略显着提高了机器人学习玩游戏的效率。
应用
这种方法是人工智能进入物理世界的一个成功例子。当机器人与其周围环境互动时,它会学习一些定义人类操作的基本技能。
阅读:Dactyl:使用 AI 实现前所未有的灵巧的类人机械手
这种触觉学习系统可以应用于积木游戏以外的任务,尤其是那些需要仔细物理交互的任务。例如,组装消费品和从垃圾填埋场垃圾中分离可回收材料。
例如,在智能手机和笔记本电脑的装配线上,大多数步骤都需要触摸和强制动作,而不仅仅是视觉,而这项技术可以极大地改善此类装配线。
工业技术