亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Industrial Internet of Things >> 物联网技术

语音生物识别解决方案以身份验证为目标

人工智能的进步现在使语音生物识别技术具有足够的准确性,不仅可以用于身份识别和个性化,还可以用于支付身份验证等应用。 Synaptics 和 ID R&D 的新解决方案提供 AI 驱动的语音生物识别和反欺骗算法,可以在边缘设备的 Synaptics SoC 上运行。具体而言,该软件针对 Synaptics VS600 系列中的神经处理单元 (NPU) 进行了优化,适用于机顶盒 (STB)、智能扬声器和安全系统等智能家居设备。

Synaptics 将其支持 AI 的 SoC 销售到需要处理视频流、音频流和成像的智能家居产品中。例如,一个典型的用例可能是包含用于视频会议的摄像头的 STB。


语音生物识别技术现在已经足够准确,可以在智能家居设备中启用支付身份验证

Synaptics 营销副总裁 Vineet Ganju 对 EE Times . “遥控器可以启用语音功能,这样你就可以通过对话来导航你的 Netflix 帐户和搜索电影……语音作为界面几乎成为这些应用程序的标准。”

当 STB 运行 Netflix 时,用户必须做的第一件事就是选择要使用的配置文件。借助语音生物识别技术,STB 可以立即知道谁在观看,从而简化流程。

“例如,通过按次付费内容,您不仅可以通过语音搜索并找到某些可能不属于您订阅的电影,而且您愿意支付 5 美元来观看,”Ganju 说。 “然后[运营商]希望能够立即进行身份验证并让您当场购买该电影。他们认为这大大减少了摩擦,不仅可以帮助用户找到适合他们的个性化内容,还可以为这些内容付费并观看。”

在设备上注册

ID R&D 的语音生物识别 AI 从语音中提取 400 多个特征,包括与频率/音高相关的参数组合以及其他事物,例如发音和口音。

ID 研发部销售高级副总裁 John Amein 告诉 EE Times ,并补充说,人工智能语音生物识别技术是在最近一年左右才达到支付认证等应用所需的准确性。

该算法通过一个称为“注册”的过程来学习识别用户的声音,在此过程中用户重复一个短语 3 次。可以使用任何短语,并且它适用于任何开箱即用的语言。注册在边缘设备上进行。

ID R&D 的 AI 算法可以识别错误接受率低于 10,000 分之一的注册用户,Amein 将其与有人猜测您的 PIN 的几率进行比较。错误拒绝率——注册用户的声音被错误拒绝的比率——接近 5%。并且欺骗接受率(SAR),对于欺骗攻击,例如向系统播放用户语音的录音,优于7%,这是Android设备生物识别解锁的标准限制。

“在生物识别匹配的错误接受率为 10,000 分之一和反欺骗优于 Android 标准要求的 7% 率之间,我们确实满足了语音生物识别被接受所必需的两件事作为支付授权足够安全,“Amein 说。

反欺骗

ID R&D的反欺骗技术也依赖于AI。

“语音具有高达 3500 Hz 的带宽,我们的采样率远高于此,”Amein 说。 “所以我们听到的频率高于口语。我们在这些更高的范围内聆听不同的特征。”

通过我们的管状声道说话产生的人声产生的特征频率与由平面振动产生的声音(例如在扬声器中)非常不同。这是反欺骗 AI 用来区分现场语音和录音的元素之一。

“我们还可以检测合成语音,例如文本到语音应用程序,”Amein 说。 “其中很多都不是那么好,但它们变得越来越栩栩如生。在这种情况下,信号中仍然存在异常——在某些情况下它太完美了,或者只是耳朵听不到的过渡或相位差,但 [AI] 可以。”

神经处理单元

Synaptics 的 VS600 系列 SoC 具有神经处理单元 (NPU); Synaptics 的 Vineet Ganju 表示,VS680 的 NPU 提供 6.75 TOPS,而新发布的 VS640 提供 1 TOPS,旨在“更主流的成本、性能和功率点”。他说,任一部分的 NPU 都有“足够多”的计算能力来同时运行 ID R&D 的语音生物识别算法和反欺骗。与使用芯片的 CPU 相比,NPU 能够将语音生物识别推理速度提高 10 倍,而 CPU 的利用率降低了 3 倍。

Synaptics 提供了一个工具集,允许像 ID R&D 这样的公司优化他们的 NPU 技术,虽然 ID R&D 是 Synaptics 在这方面的第一个合作伙伴,但该公司未来将与更多合作伙伴合作开发语音生物识别以外的应用。

“根据我们与语音识别公司的讨论,我们实际上可以在设备上做一个完整的英语词汇语音识别引擎,完全在 NPU 的 1 TOPS 能力范围内,”Ganju 说。 “因此,您可以拥有与语音识别相关的完全离线的产品……例如,对于用户不会立即将其连接到 WiFi 的产品,板载语音识别可以帮助他们获得良好的开箱即用体验,甚至在此之前它已连接。”

ID R&D 的第一个软件版本将于本月晚些时候在 Synaptics 的 VS600 开发套件中提供。

>> 本文最初发表于我们的姊妹网站 EE Times。


物联网技术

  1. 工业物联网传感器到云网关解决方案
  2. 微分方程
  3. Minterm vs Maxterm 解决方案
  4. pH 测量
  5. 制造移动性:数据、语音、视频和位置
  6. 与工业 4.0 解决方案架构师的问答
  7. 物联网解决方案开发的三大挑战
  8. 边缘计算解决方案的技术能力
  9. 西门子、宾利推出加速工厂数字化的解决方案
  10. Azima DLI 解决方案针对机器状态监控程序
  11. 客户对数控机床的声音
  12. HMI-PLC 集成