亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Industrial Internet of Things >> 嵌入式

英特尔提供 Loihi 2 神经形态芯片和软件框架

英特尔推出了第二代神经拟态计算芯片 Loihi 2,这是第一款基于英特尔 4 工艺技术构建的芯片。 Loihi 2 专为研究尖端神经形态神经网络而设计,带来了一系列改进。它们包括一个新的神经元指令集,提供更多的可编程性,允许尖峰具有超过 1 和 0 的整数值,并且能够扩展到更大系统的芯片的三维网格。

这家芯片制造商还推出了 Lava,这是一种用于开发神经启发应用程序的开源软件框架。英特尔希望让神经形态研究人员参与 Lava 的开发,一旦启动并运行,研究团队将能够在彼此工作的基础上进行开发。

Loihi 是英特尔版本的神经形态硬件,专为受大脑启发的尖峰神经网络 (SNN) 而设计。 SNN 用于基于事件的计算,其中输入尖峰的时间对信息进行编码。一般来说,较早到达的尖峰比那些较晚到达的尖峰具有更大的计算效果。


英特尔的 Loihi 2 第二代神经拟态处理器。 (来源:英特尔)

神经形态硬件和标准 CPU 之间的主要区别之一是内存的细粒度分布,这意味着 Loihi 的内存嵌入到单个内核中。由于 Loihi 的峰值依赖于时序,因此架构是异步的。

“在神经拟态计算中,计算是通过这些动态元素之间的相互作用产生的,”英特尔神经拟态计算实验室主任 Mike Davies 解释说。 “在这种情况下,正是神经元具有这种动态特性,可以在线适应它接收到的输入,而程序员可能不知道芯片要经过哪些步骤才能得出答案。

“它经历了一个自我组织状态的动态过程,并适应了一些新的条件。我们称之为最终固定点,或平衡状态,是编码你想要解决的问题的答案,”戴维斯补充道。 “因此,它与我们甚至对其他架构中的计算的看法有着根本的不同。”

迄今为止,第一代 Loihi 芯片已在各种研究应用中得到验证,包括自适应机器人手臂控制,其中运动适应系统的变化,减少手臂上的摩擦和磨损。 Loihi 能够调整其控制算法以补偿错误或不可预测的行为,使机器人能够以所需的精度运行。 Loihi 还用于识别不同气味的系统。在这种情况下,它可以比基于深度学习的等效物更有效地学习和检测新的气味。 Deutsche Bahn 的一个项目也使用 Loihi 进行列车调度。系统对轨道关闭或列车失速等变化做出快速反应。

第二代功能

Loihi 2 基于英特尔 4 工艺的预生产版本,旨在在不影响能源效率的情况下提高可编程性和性能。与其前身一样,它的功耗通常约为 100 mW(最高 1 W)。

资源密度的增加是最重要的变化之一;虽然该芯片仍包含 128 个内核,但神经元数量增加了 8 倍。

“在单个芯片中获得更多的存储、神经元和突触对于商业可行性至关重要……并以对客户应用有意义的方式将它们商业化,”戴维斯说。

点击查看全尺寸图片

Loihi 2 功能。 (来源:英特尔)

使用 Loihi 1,工作负载通常会以非最佳方式映射到架构上。例如,当空闲内存仍然可用时,神经元计数通常会达到最大值。 Loihi 2 中的内存量总体上是相似的,但被分解为更灵活的内存条。对网络参数添加了额外的压缩,以最大限度地减少较大模型所需的内存量。这释放了可以重新分配给神经元的内存。

结果是 Loihi 2 可以用相同的内存量解决更大的问题,每毫米神经网络容量大约增加 15 倍 2 芯片面积——记住,新工艺技术使芯片面积整体减半。

神经元可编程性

可编程性是另一个重要的架构修改。以前功能固定但可配置的神经元在 Loihi 1 中获得了 Loihi 2 中的完整指令集。该指令集包括常见的算术、比较和程序控制流指令。这种程度的可编程性将允许更有效地运行各种 SNN 类型。

“这是一种微代码,允许我们对几乎任意的神经元模型进行编程,”戴维斯说。 “这涵盖了 Loihi [1] 的局限性,通常我们发现可以通过更复杂和更丰富的神经元模型来解锁更多应用价值,这不是我们在 Loihi 开始时所期望的。但现在我们实际上可以涵盖我们的合作伙伴试图研究的所有神经元模型,以及计算神经科学领域 [正在] 提出和表征的内容。”


Loihi 2 芯片是第一个采用英特尔 4 工艺技术的预生产版本制造的芯片。 (来源:英特尔)

对于 Loihi 2,尖峰的概念也得到了推广。 Loihi 1 采用严格的二元尖峰来反映生物学中所见,尖峰没有大小。所有信息都由尖峰时间表示,较早的尖峰比后期的尖峰具有更大的计算效果。在 Loihi 2 中,尖峰携带可用于可编程神经元模型的可配置整数有效载荷。虽然生物大脑不会这样做,但戴维斯表示,英特尔在不影响性能的情况下相对容易地将其添加到硅架构中。

“这是我们偏离严格的生物学保真度的一个例子,特别是因为我们了解重要性是什么,它的时间编码方面,”他说。 “但是 [我们意识到] 我们可以做得更好,如果我们有额外的量级可以与这个峰值一起发送,我们可以用更少的资源解决同样的问题。”

基于广义事件的消息传递是 Loihi 2 支持称为 sigma-delta 神经网络 (SDNN) 的深度神经网络的关键,该网络比 Loihi 1 上使用的计时方法快得多。SDNN 以相同的方式计算分级激活值与传统 DNN 一样,但仅在发生重大变化时以稀疏的、事件驱动的方式进行交流。

3D 缩放

Loihi 2 据称在电路级别上比其前身快 10 倍。戴维斯声称,结合功能改进,该设计可以提供高达 10 倍的速度增益。 Loihi 2支持200ns以下的最小全芯片时间步长;它还可以比生物神经元快 5,000 倍的速度处理神经形态网络。

新芯片还具有可扩展端口,允许英特尔将神经网络扩展到三维。由于没有运行更大神经网络的外部存储器,Loihi 1 需要多个设备(例如英特尔的 768-Loihi 芯片系统 Pohoiki Springs)。 Loihi 1 芯片的平面网格变成了 Loihi 2 中的 3D 网格。同时,芯片到芯片的带宽提高了四倍,压缩和新协议提供了芯片之间发送的冗余尖峰流量的十分之一。 Davies 表示,对于大多数工作负载,总容量提升了大约 60 倍,避免了由芯片间链接引起的瓶颈。

还支持三因素学习,这在前沿神经形态算法研究中很流行。将第三个因素映射到特定突触的相同修改可用于近似反向传播,这是深度学习中使用的训练方法。这创造了通过 Loihi 学习的新方式。


Loihi 2 将作为用于开发边缘应用 (Oheo Gulch) 的单芯片板提供给研究人员。它还将作为八芯片板提供,旨在为更苛刻的应用进行扩展。 (来源:英特尔)

熔岩

Lava 软件框架完善了 Loihi 增强功能。该开源项目可供神经形态研究社区使用。

“软件继续阻碍着这个领域,”戴维斯说。 “在过去的几年里,进展并不大,与硬件的步伐不同。并且还没有出现单一的软件框架,正如我们在深度学习领域所看到的那样,我们的 TensorFlow 和 PyTorch 正在积累巨大的动力和用户群。”

虽然英特尔为 Loihi 演示了一系列应用程序,但开发团队之间的代码共享受到限制。这使得开发者更难在其他地方取得的进展基础上再接再厉。

戴维斯说,作为一个新项目而不是产品推广,Lava 旨在作为一种构建框架的方式,支持 Loihi 研究人员研究一系列算法。虽然 Lava 的目标是基于事件的异步消息传递,但它也将支持异构执行。这允许研究人员开发最初在 CPU 上运行的应用程序。通过访问 Loihi 硬件,研究人员可以将部分工作负载映射到神经形态芯片上。希望这种方法有助于降低进入门槛。

“我们看到这里需要融合和共同发展以实现这一更大的目标,这对于神经形态技术的商业化是必要的,”戴维斯说。

Loihi 2 将被开发高级神经形态算法的研究人员使用。 Oheo Gulch 是一种用于实验室测试的单芯片系统,最初将提供给研究人员,随后是 Kapoho Point,Kapoho Bay 的八芯片 Loihi 2 版本。 Kapoho Point 包含一个以太网接口,旨在允许堆叠电路板以用于需要更多计算能力的机器人等应用。

Lava 可在 GitHub 上下载。

>> 本文最初发表在我们的姊妹网站 EE次。


相关内容:

有关 Embedded 的更多信息,请订阅 Embedded 的每周电子邮件通讯。


嵌入式

  1. 资产管理和资产跟踪软件的 16 项战略优势
  2. Pulsic 在原理图编辑器中提供实时模拟芯片布局预览
  3. Cypress:Cirrent 的软件和云服务简化了 Wi-Fi 连接
  4. 英飞凌:iMOTION IMM100 系列减少了 PCB 尺寸和研发工作
  5. Würth Elektronik 提供光电二极管和光电晶体管
  6. 瑞萨电子:RX23E-A 组在单芯片上集成了 MCU 和高精度 AFE
  7. SECO:基于第 8 代英特尔酷睿 U 和第 9 代酷睿 H 处理器的新解决方案
  8. 精密测量开发平台提供硬件套件、软件工具
  9. C# 和 .Net 版本历史
  10. 各种工业物联网软件、硬件
  11. 库存管理软件:功能和优势
  12. 3D 设计:弯管和设计软件