亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Industrial Internet of Things >> 物联网技术

沟通全面展开——我们是否正在回到语音优先的世界?

阿尔卡特朗讯企业的 Craig Walker

随着 Siri、Cortana 和 Google 等个人助理的兴起 助理,以及利用人工智能 (AI) 和分析来建立个人伴侣的新初创企业,很明显我们正朝着与技术建立新的语音控制关系迈进。

正如我们在消费者市场上看到的那样,这些语音激活系统最终将进入企业环境几乎是理所当然的,因为这些系统在简化和自动化活动方面的潜在好处可能是巨大的。

Alcatel-Lucent Enterprise 云服务总监 Craig Walker ,解释说,虽然我们可能需要很长时间才能看到“2001:太空漫游”中“HAL”的完整相似之处,但这项技术已经出现,可以改善企业的运营方式。

灯光、相机、动作!

想想医生只要说“系统:用以下内容更新 Mary Smith 的图表:“患者出现腹痛,签发 200 毫克‘SuperAntiGas’的药房订单,签署 FeelBetter 医生。”或者在会议室里,与其费力去弄清楚哪个遥控器放在投影仪和屏幕上,一个简单的语音请求“系统:打开投影仪,打开电视,调暗灯光。”

挑战

那么,我们在通往语音优先的道路上处于什么位置?语音分析公司 VoiceLabs ,提供了对支持消费者世界中语音优先方法所需的各个层的看法。但是,要从简单的基于消费者的用例转变为在企业世界中提供更加语音优先的环境,需要做一些事情。

如果我们要开始让我们的企业系统依赖语音命令,那么安全性将是至关重要的——任何人都应该能够通过说话来控制关键设备或系统吗?答案显然是否定的。隐私也是一个首要问题,虽然上面的医生例子看起来很简单,但我们需要在法规的背景下考虑这一点。如果这些口头命令将患者的医疗信息暴露给第三方,患者的权利(根据美国的 HIPAA 规定)是否会受到侵犯?

安全访问

我们已经看到了语音识别系统的下一步,该技术能够支持安全访问。银行是在其电话银行系统中引入语音认证的公司之一。虽然这可能会让一些客户有点担心他们帐户的安全性,但我的感觉是它将遵循我们在电子商务中看到的采用周期,在我们看到信用卡欺诈的最初担忧出现之前,我们需要克服它的迅速崛起在线购买。

我们将继续看到语音识别系统的持续创新和改进,这些改进将使语音系统安全在企业环境中切实可行,并确保只有具有正确权限的授权用户才能执行相关操作。

虽然您的微波炉可能不会监视您,但某些设备将始终处于开启状态,始终在收听并可能进行录音。一些广为人知的侵犯隐私、商业间谍或法律危险的案例可能会阻碍采用。这表明语音优先的产品需要包含一个大的开/关开关或功能,这样用户就可以在不冒持续监控的缺点的情况下获得好处。还需要在产品中提供安全的软件访问,以防止和检测黑客行为。

构建更有效的语音识别系统

第一个用例主要围绕语音响应系统——无论是从呼叫中心的角度还是在我们的汽车和智能手机中实施的系统。但正如我们许多人从第一手经验中知道的那样,这充其量只能起到一点作用。在我们现实地考虑在企业范围内采用之前,需要通过技术发展来完善识别和情境化。

卡内基梅隆大学的 Sphinx 项目等研究项目不断增强语言识别能力。 Mary Meeker 的一份互联网趋势报告指出,2016 年,谷歌的语音识别系统可以识别超过 500 万个单词,准确率约为 90%——但这仍然不够广泛或准确。 90% 的准确率是否足以与医院的生命支持系统或公用事业提供商的网络进行交互?

这也不仅仅是关于单词的识别,而是关于如何处理这些单词。这就是认知引擎和人工智能发挥作用的地方。业内一些最大的参与者 - 例如 Microsoft ,凭借其开源认知识别引擎——可用于理解单词的上下文。 “我怎么去格林公园?”听起来很简单,但需要结合上下文。

位置感知可能表明您可能指的是伦敦的绿色公园以及对交通方式的假设。如果你坐在皮卡迪利广场,答案可能是,“在皮卡迪利线上西行一站。”但这里我们假设它是伦敦的格林公园,而不是曼彻斯特或伯明翰的格林公园。

寻找更深层的意义

真正的挑战在于语音识别系统的背后是什么——从物联网设备到系统本身的集成,以及确保所请求的命令有意义。在这里,我们需要进一步利用这些认知引擎作为检查和验证系统。

想想有人不小心发出了“关闭反应堆 4 的冷却系统”而不是反应堆 3 的命令 - 反应堆已经关闭,或者医生使用该系统开出有害剂量的药物,因为他不小心说 400 克而不是400 毫克。

这些可能是极端的例子,但需要对正在自动化的操作有一个整体的看法,以防止人为错误并引入更广泛的智能来理解与语音控制请求相关的操作。例如,也许“关闭反应堆 4 的冷却系统”是正确的,但系统随后需要了解一套操作程序来实施这些操作。

为真正的语音集成解决方案创建 API 平台

一个有趣的元素可以与真正的语音控制的企业环境的发展战略性地联系起来,它来自传统语音通信世界中发生的创新。我们看到企业中 CPaaS(通信平台即服务)的爆炸式增长,利用 API 将当今的应用程序转变为语音集成解决方案。

一些主要的语音通信供应商现在正在进入这个市场,为 CPaaS 基础设施提供一组标准化的 API,使公司能够将通信集成到他们的业务流程中。

虽然我们传统上将集成视为将语音和视频服务整合到现有应用程序中的事情——想想一个银行应用程序,它允许您从在线应用程序转移到与银行顾问的语音通话——我相信这些将在通过利用 CPaaS 丰富的 API 基础架构与应用程序和事物进行通信,实现“语音优先”环境。

在通信基础设施需求背后,CPaaS或其他平台如何与设备通信确实需要标准化,才能看到语音技术的快速发展。当今每个基于消费者的语音控制系统都有自己的接口、自己的 API 集成,并且与几十年前历史性的“Beta 与 VHS”之战一样,可能会导致产品过时。

就像消费者不想投资最新的“智能咖啡机”却发现控制它的平台刚刚停产一样,企业希望确保他们对新技术的投资不会过时。能够实现回报。

最好的还在后头

好消息是有一组技术正在开发中,以帮助最大程度地减少潜在的过时。正在开发 IoTivity 等框架以构建标准化平台。我们已经看到了面向消费者的新语音应用的价值、好处和快速扩展。在短期内,我们将看到一些基本用例进入企业。

从长远来看,随着语音识别、语音安全和设备连接的简化/标准化不断取得进步,我们将在消费者和企业领域看到越来越多的语音优先活动,以帮助降低复杂性并提高我们的生产力。

此博客的作者是阿尔卡特朗讯企业云服务总监 Craig Walker


物联网技术

  1. 染料世界一览
  2. AI 缓慢移动到工厂车间
  3. 使用 MQTT 轻松进入物联网世界
  4. 来自我们的 CEO:勇气和信任是前进的必要条件
  5. 安全和隐私是否阻碍物联网?
  6. 将智能通信集成到每个“事物”中
  7. 为什么主要 OEM 转向内部芯片生产
  8. 食品生产商如何应对以交付为导向的世界
  9. 为什么美国公司将其供应链从中国转移到墨西哥
  10. 集装箱掉入海中。发生了什么?
  11. Covid 的五个教训:回顾过去,继续前进
  12. 什么是有色金属?- 完整指南