开发套件加速 Alexa 集成

设计工程师可以利用硬件模块和软件服务将Alexa语音服务（AVS）集成到智能家居、汽车和可穿戴设备中；它将基于云的 Alexa 体验带到了从便携式扬声器到智能电器再到车载信息娱乐系统的产品中。开发人员可以将 Alexa 集成到基于语音的产品中，并编写一个配套应用程序，将产品变成互联产品。

自从亚马逊于 2014 年将最初的 Alexa 设备推向市场以来，亚马逊网络服务 (AWS) 以及几家芯片制造商已经推出了参考设计，通过提供预先构建和预先测试的设计，帮助工程师集成亚马逊的语音识别技术和 AVS 接口。

因此，如果您的公司没有很多工程师从事硬件和软件开发，参考设计可以简化基于 Alexa 设计的简单且经济高效的自然语言理解和语音界面的开发。否则，高质量音频处理的集成会使支持语音的设备的开发变得漫长而复杂。

图 1. 基于 AVS 的语音应用程序的参考设计旨在将亚马逊的语音识别技术无缝集成到语音控制设备中。资料来源：意法半导体

唤醒词检测

这一切都始于一个强大的唤醒词引擎 (WWE)，它在系统采取任何行动之前侦听关键字“Alexa”。有一个基于云的唤醒词验证，可以验证上下文并确保用户真的想要 Alexa。在这里，参考设计的语音捕获部分通过在现实条件下执行音频捕获来增强“Alexa”唤醒词检测。使设计师即使在中等距离也能中断嘈杂的环境。

以适用于 Amazon AVS 应用程序的 Cirrus Logic 语音捕获开发套件为例；它通过经过验证的硬件和软件组件提供声学调谐。该套件改进了安静和嘈杂环境中的“Alexa”唤醒词检测，即使用户距离设备几米远。它通过抑制噪音和其他现实世界的干扰来实现更准确和可靠的语音交互。

图 2. 远场 AVS 参考设计针对智能扬声器和其他语音控制的智能家居设备。资料来源：Cirrus Logic

如上所示，该套件包括一个带有两个麦克风阵列的语音采集板、Raspberry Pi 3 (RPi3)、扬声器和一个预装了所需固件的 microSD 卡，以实现即时生产力。控制台简化了各种 RPi3 应用程序的操作，并提供了一个用户友好的界面来执行声学调谐和诊断功能。

语音捕获板采用 Cirrus Logic 的 CS47L24 智能编解码器、CS7250B 数字 MEMS 麦克风和用于语音控制、噪声抑制和回声消除的 SoundClear 算法。在这里，智能编解码器集成了高保真 DAC、立体声耳机放大器和单声道扬声器放大器，以减少电路板空间和物料清单 (BOM)。

其次，具有超低本底噪声和 103 dB 宽动态范围的 MEMS 麦克风可确保在具有挑战性的噪声条件下精确捕捉语音。最后，SoundClear 算法会阻止噪音，否则会干扰 Alexa 唤醒词。

这使得该套件能够在现实条件下有效地执行“Alexa”唤醒词检测和音频捕获，即使是在嘈杂环境中的中等距离，使用户能够可靠地中断嘈杂的音乐或 Alexa 响应播放。

音频前端

基于 AVS 的设计中的基本硬件包括多个麦克风和一个音频前端 (AFE)，可确保在安静和嘈杂的环境中都能检测到“Alexa”唤醒词。这使得音频前端成为任何 AVS 参考设计的关键构建块。

音频前端拾取用户的声音，将其放大，减少背景噪音，并将其发送到云端。这很难做到，因此，使用开发套件是创建音频前端的好方法。

以TalkTo为例，DSP Concepts的音频前端具有AVS合格的集成语音处理；它已针对基于芯片制造商 STM32 MCU 的 STMicroelectronics 的 AWS IoT Core 参考设计推出。 TalkTo 音频前端具有降噪、回声消除和基于用于远场音频检测的先进波束成形的信号处理功能。它是通过 Audio Weaver 交付的，这是一款免费工具，可帮助开发人员微调 AVS 设计。

图 3. 单芯片解决方案包括音频前端处理、本地唤醒字检测、通信接口以及包括 RAM 和闪存在内的存储器内容，可降低 BOM 成本并简化布局。资料来源：意法半导体

ST 的 36×65 毫米板将 Wi-Fi 模块与 STM32H743 MCU 相结合，将音频前端处理、本地唤醒词检测、通信接口和存储器集成在单个芯片中。参考设计硬件还包括一个音频子板作为单独的模块，以进一步简化开发和原型设计。

子板包括 FDA903D 音频编解码器、用户 LED 和按钮，以及两个间距为 36 毫米的 MP23DB01HP MEMS 麦克风，用于尺寸受限的设计。这也使开发人员能够加入关闭麦克风的隐私模式，因此红色 LED 可以通知用户 Alexa 无法听到语音命令。

远场语音识别

其他芯片制造商也加入了集成亚马逊远场语音识别技术的参考设计。例如，恩智浦推出了一个参考平台，声称即使在播放嘈杂的音乐时，它也能识别来自整个房间的用户请求。

NXP 的 Amazon Alexa 参考平台包括 7 麦克风阵列设计、音频处理算法和波束成形技术。它将亚马逊的远场语音识别技术与恩智浦的 i.MX 应用处理器集成，同时旨在简化语音控制设备的创建。

Alexa 等支持语音的设计改变了用户与从烤面包机、炊具、恒温器到百叶窗等智能设备交互的方式。在这里，参考板和语音捕获套件为各种支持 Alexa 的产品提供了最快的上市途径，同时即使在嘈杂的环境中也能确保高度准确的唤醒词触发和命令解释。

我们正处于语音设备革命的开端，这些应用的多样性意味着预先设计和预先测试的参考板和套件可能会发挥重要作用。他们的角色对于将支持语音的产品更快地推向市场并绕过其设计复杂性至关重要。

>> 本文最初发表于我们的姊妹网站 EDN。

边缘和端点 AI 与云相遇的地方促进大规模物联网供应

物联网技术