TossingBot:一种可以每小时将 500 个物体投掷到目标位置的机械臂
- 新机器人学会拾取任意物体并将其扔到特定位置。
- 它同时使用深度学习和弹丸物理学,在非结构化环境中准确快速地抛掷物体。
- 在 14 小时的训练时间内,它实现了 85% 的投掷准确率,87% 的杂波把握可靠性。
在过去十年中,在使机器人更智能以更有效地完成特定任务并从现实世界中学习经验方面取得了重大进展。然而,机器人在基本技能上——比如接球、摆动、旋转和抛掷——仍然远远落后于人类。
现在,谷歌、麻省理工学院、普林斯顿大学和哥伦比亚大学的研究人员开发了一种新的机械臂,可以学习捡取任意物体并将其扔到特定位置。它同时使用物理和深度学习方法,在非结构化环境中准确快速地抛掷随机物体。
他们将这个机器人命名为 TossingBot。与以往机器人相比,拾取速度最高可达两倍,有效放置范围增加一倍。
所涉及的挑战
扔东西对机器人来说不是一件容易的事。这涉及到许多因素,从如何拾取不同形状的物体到物体的质量、空气动力学和摩擦等物理特性。
例如,如果你从边缘捡起一个又重又长的物体并扔掉,它会比从中心捡起它落到更远的地方。然而,如果你捡到一个像乒乓球这样的轻物体,你需要很大的力(由于空气阻力)才能把它扔到同样的距离。
手动开发一种技术来明确控制每个任意对象的所有这些参数几乎是不可能的。应用试错技术也不是一个好主意,因为它既昂贵又耗时。
结合深度学习和物理
虽然深度学习可以帮助机器人从经验中学习,而不是依赖逐案机制,但将物体精确地投掷到目标位置需要对射弹物理有很好的理解。
参考:arXiv:1903.11239 |谷歌人工智能博客
通过集成这两个功能,工程师使 TossingBot 能够快速训练并推广到新场景。机器人利用抛射物物理学的一些基本定律开发初始控制器,例如计算将特定物体投掷到目标位置所需的投掷速度。
然后神经网络在物理计算的基础上预测调整,以补偿现实世界中的可变性和噪声等外部因素。除了训练之外,机械臂还依靠 NVIDIA Titan GPU 实时重建 3D 场景(使用 RGB 深度相机捕获),并在机械臂四处移动时聚合 3D 数据。
在 14 小时的训练时间内,TossingBot 实现了 85% 的投掷准确率,87% 的杂波抓取可靠性。它能够捡起 500 多个任意物体并将其扔进放置在其最大触及范围之外的盒子中。
下一步是什么?
虽然结果看起来相当令人印象深刻,但机器人确实有它的缺点。例如,它假定物体的强度足以抵抗着陆碰撞。此外,它仅根据视觉信息评估控制变量。
阅读:新的人工智能系统教机器人直接向人类学习
在下一项研究中,研究人员将训练他们的系统以缓冲着陆的方式捕捉物体。他们还计划探索其他传感方式(如触觉和力扭矩),使机械臂能够更好地适应其投掷速度。
工业技术