AI 芯片面向低功耗边缘设备
位于圣地亚哥和台湾的 AI 硅和 IP 初创公司 Kneron 推出了一款 AI SoC,该 AI SoC 具有该公司神经处理单元 (NPU) IP 的更新版本。 KL720 还具有 Cadence DSP AI 协处理器和用于系统控制的 Arm Cortex M4 内核。据该公司称,虽然耐能的下一代 AI SoC 针对低功耗边缘和智能家居设备,如可视门铃和机器人吸尘器,但 KL720“可用于从特斯拉到烤面包机的所有设备”。
耐能声称这款第二代芯片在能效方面优于英特尔 Movidius 系列和谷歌 Coral Edge TPU 的芯片。 KL720 的 NPU 模块可以执行 1.4 TOPS,而整个 SoC(包括额外的 DSP 和 Cortex M4 内核)的性能为 0.9 TOPS/W。这足以处理高达全高清 1080p 分辨率的 4K 分辨率图像和视频。这与耐能2019年5月发布的上一代芯片KL520相比,可以在0.6 TOPS/W下达到0.3 TOPS。
Kneron 的 KL720 AI SoC 采用该公司的 NPU IP、DSP AI 协处理器和 Cortex M4 系统控制内核(图片:Kneron)
虽然上一代芯片仅针对图像处理,但耐能的下一代 AI SoC 也非常适合音频处理。随着语音控制接口的日益普及,边缘设备内部对人工智能处理的需求越来越大,因为它比在云中处理更快、更便宜,并维护用户隐私。耐能表示,KL720 具有足够的处理能力来识别“整个字典中的单词”,远远超过只能识别特定唤醒词的竞争芯片。
至少从 1 月起,耐能就一直在向客户展示 KL720 的原型。该公司成立于 2015 年,开始为包括面部识别在内的用例开发 AI 模型。除了人工智能芯片,该公司还授权其 NPU IP; KL720 中的 NPU 版本已成功与 Cadence Tensilica Vision P6 DSP IP 和 Synopsys 的 ARC 处理器 IP 集成。
使 NPU 能够同时处理图像和音频的关键是其可重构设计。
“我们将主流 AI 框架和 [卷积神经网络] 模型分解为基本构建块,并根据需要的应用程序和我们正在使用的 AI 框架重新配置它们,以便我们的解决方案能够适应并加速相关的 CNN 模型,”耐能首席执行官 Albert Liu 告诉 EE Times 在之前的采访中。
“例如,ResNet(用于人脸识别)和 LSTN(用于语音识别)虽然一个是音频,另一个是视觉,但具有共同的构建块,”刘说。 “虽然其他解决方案供应商可能需要用独立的解决方案来支持他们,但耐能的解决方案在我们的可重构 AI 引擎中重新配置了通用构建块,以便我们可以实时支持基于 AI 应用程序的不同模型,如 ResNet 和 LSTM。”
Kneron 的 KL720 可以同时处理视频和音频(图片:Kneron)
耐能最近还宣布了 Kneo,这是该公司用于连接 AI 驱动传感器的私有网状网络。 Kneo 旨在允许消费者的设备(至少,那些包含耐能芯片的设备)在不向云端发送任何数据的情况下协同工作。数据存储在本地,受区块链保护。该公司表示,Kneo 还将允许消费者将他们的数据远离“大科技”,如果他们愿意,甚至可以按照自己的条件出售自己的数据。
KL720 的样品将“很快”提供。
>> 本文最初发表于我们的姊妹网站 EE Times。
嵌入式