更少的嵌入式耳朵,更多的声控设备
XMOS 的那些聪明人让我们更接近于在我们与之交互的几乎所有设备中嵌入用于语音控制的“耳朵”。
提醒一下,XMOS 是一家无晶圆厂半导体公司,开发语音解决方案、音频产品和多核微控制器,能够同时执行实时任务、极限数字信号处理 (DSP) 和控制流。 XMOS 微控制器以其确定性(可预测)的行为而著称。
让我们从底层的 xCORE 多核微控制器技术开始,该技术包括通过高速开关连接的多个“处理器块”。每个处理器块都是一个传统的 RISC 处理器,最多可以同时执行八个任务。任务可以通过通道(可以连接到本地磁贴上的任务或远程磁贴上的任务)或使用内存(仅适用于在同一磁贴中运行的任务)相互通信。
xCORE 架构在硬件中提供了许多通常在实时操作系统 (RTOS) 中看到的元素。这包括任务调度程序、计时器、I/O 操作和通道通信。通过消除时序不确定性来源(中断、缓存、总线和其他共享资源),xCORE 设备可以为许多应用程序提供确定性和可预测的性能。任务通常可以在纳秒内响应外部 I/O 或计时器等事件。这使得对 xCORE 设备进行编程以执行硬实时任务成为可能,否则需要专用硬件。
2017 年,XMOS 收购了 Setem Technologies。正如我在“XMOS + Setem 可能成为嵌入式语音游戏规则的改变者”专栏中所写:“Setem 的 chaps 和 chapesses 是高级盲源信号分离技术的先驱。他们的专利算法使消费者设备能够在拥挤的音频环境中专注于特定的语音或对话,以实现对语音识别系统的优化输入。”
我家里有两台 Amazon Echo/Dot 设备,办公室有一台(我问我的妻子 Gina the Gorgeous,为什么她在窃窃私语。“我听说亚马逊的人可能在听我们说话,”她说。我笑了,吉娜笑了,Alexa 笑了……)。我认为这些设备很棒,但它们确实需要一个由七个麦克风组成的阵列,这会增加整个解决方案的成本和物理占用空间。
拥有多个麦克风可以让系统更好地检测和消除噪音,执行回声消除等操作,并确定声音源(如说话的人)的位置。当然,当你想到它时,我们设法用两只耳朵完成所有这些事情(我不了解你,但我认为我的头上没有足够的空间来容纳七只耳朵,至少没有其中一个妨碍了)。
毫不奇怪,XMOS 的人也发现了这一点,这就是为什么他们刚刚推出了新的 XVF3510 下一代语音处理器,只需使用两个麦克风就可以从拥挤的音频环境中提取单个声音。
<中心>
XVF3510 安装在 PCB 上(来源:XMOS)
中心>
XVF3510 上运行的算法包括干扰消除(消除点噪声源以消除不需要的背景噪声)、立体声回声消除(抑制不需要的扬声器回声并启用插入)和自适应延迟估计(动态调整音频参考信号延迟,从而确保回声消除算法提供流畅、实时的体验。
物联网技术