让机器人个人助理无处不在
我最近参加了 MWC 上海。机器人很大——非常大。我看到了数十家公司,他们正在寻找客户来打造品牌并在许多应用程序中的任何一种中提供它们。仅举一个示例应用程序 - Tug,机器人护士。这看起来不太像我们的机器人科幻形象,除非你想到星球大战中一些更实用的例子。这是一个带轮子的盒子,但它具有许多我们期望在移动机器人中使用的功能,包括导航和避障。它可以在医院周围导航,如果有人走到它前面,它会停下来,它会绕过错误的静脉输液架;也可以叫电梯到另一层。
Tug 的目的是为患者提供药物和食物,它已经部署在美国 37 家退伍军人医院。想象一下忙碌的糖果脱衣舞者肩上的工作量。在老年人护理、教学支持、餐厅和酒店等领域,还有多种其他辅助应用程序。将其视为继智能扬声器之后个人助理的下一件大事(亚马逊已经有 10 万多个机器人在他们的仓库中工作,因此很明显他们正在开发家用机器人作为 Echo 的续集)。这不是科幻小说;家庭助理机器人今天发货。
机器人健康助手(来源:CEVA/Shutterstock) 字体>
生产这种机器人存在明显的技术挑战,与自动驾驶问题没有什么不同,尽管存在一些明显的差异。导航和避障很常见,但这些机器人并不适用于清晰的车道和交通管理的概念;这完全是关于建筑物内的障碍物回避和导航(重新映射以绕过临时不可移动的障碍物)。虽然自然语言界面在汽车中可能是一个不错的选择,但对于机器人助手来说,它可能是必不可少的。当药房送错了药,或者餐厅弄乱了您的订单时,谁愿意学习按按钮?
Gartner 最近提出了机器人对人工智能和传感要求的前 10 名清单,其中包括:
计算机视觉——场景分析、物体识别等
生物识别和身份验证——谁在和我说话,他们被允许发出这些命令
对话界面——语音识别和自然语言处理
声学风景分析——识别独特的噪音,如狗吠或玻璃破碎
位置感知——我在哪里,什么/谁在我附近
自主移动——能够在不与物体或人碰撞的情况下移动到建筑物其他地方的目标
机器人中的人工智能功能——不仅取决于云
当今构建具有这些功能的系统的默认方法是将 AI 系统构建到基于多核 GPU 平台的机器人中。这是可以理解的——产品制造商可以使用现成的平台对解决方案进行原型设计,而无需担心 ASIC 细节,就像他们将 CPU 开发板用于更传统的应用程序一样。但随着产品数量的增加或您正在推动它增加,成本和客户满意度/差异化变得越来越重要。现成的解决方案价格昂贵、耗电,而且当您与其他人使用相同的平台时,很难区分它们。这就是为什么大批量解决方案不可避免地转向 ASIC 平台的原因。您不需要放弃对原型的所有投资;成本较低的 GPU 平台可能仍然是解决方案的一部分,但可以将大量 AI 功能卸载到更具成本效益和高度集成的平台上。
在机器学习 (ML) 应用程序中,DSP 相对于 GPU 的每瓦性能优势是众所周知的,部分原因是定点运算优于浮点运算以及某些平台中量化的灵活性。定制解决方案的价格优势(在数量上)是众所周知的。这就是为什么与现成的 GPU 相比,您更可能在边缘的数量/价格敏感的 ML 应用中看到嵌入式 DSP。
但是你能做所有你可以在 GPU 上做的事情吗?事实证明,你可以做很多事情。以计算机视觉——定位、跟踪、物体识别和手势识别为例。如今,某些基于 DSP 的嵌入式平台已具备这种级别的视觉处理能力。或者采取支持本地再培训的自主运动(无需上云)。同样,支持这种智能的核心识别功能,您也可以在 GPU 上找到的相同功能,可在 DSP 上使用。
语音识别/认证和声学场景分析也可以卸载。这些(以及这里的其他示例)巧妙地突出了为什么卸载如此有意义。这些智能操作中的每一个都分解为多个步骤,例如从语音拾取和方向解析到基本的单词识别,最终甚至是自然语言处理 (NLP)。最后一步是具有挑战性的,可能需要转到云端。但是在嵌入式解决方案中可以非常轻松地处理之前的步骤。在某些应用程序中,只需要识别有限的词汇,或者您想要检测非语言提示(例如打破窗户),您可能根本不需要云(或本地 GPU)。已经有迹象表明,在不久的将来,即使是有限的 NLP 也可能在边缘得到支持。
已经出现了一系列广泛的解决方案来支持这些在边缘使用人工智能、前端语音处理和物联网深度学习的前端功能。使用这些解决方案,开发者可以更轻松地应对新出现的挑战,让机器人个人助理无处不在。
摩西谢尔 他是 CEVA 战略营销总监,负责监督 CEVA 核心目标市场和未来增长领域的企业发展和战略合作伙伴关系。 Moshe 与领先的软件和 IP 公司合作,将基于 DSP 的创新解决方案推向市场。在业余时间,Moshe 骑山地自行车并练习合气道。
物联网技术