亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Industrial Internet of Things >> 物联网技术

融合技术支持十亿级 Elasticsearch

随着原本不相关的技术以令人兴奋的新方式融合在一起,数字融合正在我们身边发生。 iPhone 就是一个完美的例子,它将手机与计算机、相机和传感器结合在一起,提供出色的体验。

融合在嵌入式领域并不新鲜。嵌入式设备传统上受到更严格的内存和处理限制,并且已经采用融合作为一种方式来充分利用许多技术领域。因此,由于我们才刚刚开始不同规模的技术融合,看似不同的技术有望联合起来颠覆现有行业并迎来引人注目的新机遇,嵌入式领域也将受益。一种新的收敛是使用 k-NN 最近邻 (k-NN) 和内存加速处理,为十亿级 Elasticsearch 操作提供近乎实时的响应。

Elasticsearch 是一个搜索引擎,它接受 JSON 请求进行文档搜索,并提供 JSON 数据作为结果。 Elasticsearch 数据格式是一种包含以 JSON 编码的结构化数据的文档。 Elasticsearch 最初是作为文本搜索引擎,但数据库可以覆盖任何类型的数据,每个文档都有唯一的 ID 和数据类型。

因为该结构是“无模式的”,它允许根据用户需要定义文档。 Elasticsearch 数据库中的文档示例包括:

Elasticsearch 被设计为分布式的。它在基础设施方面具有可扩展性,并且可以灵活用于本地服务器、远程服务器或基于云的操作。由于其开放和宁静的 API 结构,可扩展的搜索引擎可以通过插件轻松使用。一个这样的插件来自 GSI Technology,它提供了许多好处,包括硬件加速 k-NN、使用向量进行多模态搜索以及合并分数结果。

Elasticsearch 依靠其分布式计算支持来实现可扩展性,对于百万级数据库搜索,其惊人的速度在几秒钟的量级。由于其分布式特性和分片支持,Elasticsearch 允许复制数据、并行搜索并加快大型数据库的搜索速度。来自 HTTP 命令发布的分布式功能还允许嵌入式设备对不同分辨率进行多次搜索 - 一次搜索本地资源,另一次发送到上游资源。

Core Elasticsearch 使用计算量很大的穷举匹配(匹配全部),这会减慢速度或使其在重复硬件中非常昂贵以支持大规模数据库搜索。一种可用于增加数据库大小的技术是 k-NN 搜索。它的工作原理是首先寻找共同分组中的相似性,然后在这些一个或多个分组中进行最终搜索。这种技术还允许在边缘规模的服务器上进行大型数据库搜索,而不是针对延迟非常敏感的应用程序的基于云的计算农场。

具有计算挑战性的方法

虽然 k-NN 为 Elasticsearch 提供了一种方法来支持非常大的数据库,例如十亿级及以上级别的数据库,但它是计算详尽的。因此,由于在 GPU 或 CPU 内核之间移动数据库的限制,k-NN 一直是加速的挑战。

工作负载加速的最大限制之一是处理器和内存之间所需的数据交换的限制。现代处理器中使用的冯诺依曼架构的一个主要缺点是处理器和存储之间的数据传输开销。 CPU 必须为它所做的每个操作取出数据。

这种架构在卸载加速环境中效率更低。此类系统的性能受到请求操作的主机以及执行操作的计算引擎通过内存交换数据的速度的限制。

正在研究减少来自内存的数据流的架构,以帮助缓解冯诺依曼瓶颈。然而,在处理内存密集型人工智能应用程序时,瓶颈尤其严重。人工智能相关应用程序的运行依赖于内存中海量数据的快速高效移动。需要将经过训练的数据库加载到工作内存和矢量化输入查询中。接下来需要对它们进行处理和加载,以便比较函数进行操作。

一种已经在市场上产生影响的成熟技术是关联处理单元 (APU)。内存加速的美妙之处在于存储本身变成了处理器。这不是大量靠近缓存的处理核心阵列,而是具有内置于读取线架构中的计算单元的内存阵列。

因此,APU 的与众不同之处在于其内存阵列能够加速计算。这种类型的“加速”处理器已被证明可以将性能提高几个数量级,同时降低标准服务器的工作负载功耗。

Elasticsearch、k-NN 和 APU 加速的融合提供了更少的延迟和更多的每秒查询。它还可以以比仅使用传统 CPU 或 GPU 加速的系统更低的功率为十亿级数据库搜索提供支持。在嵌入式空间中,Elasticsearch 可以提供一种在边缘设备上进行本地搜索的方法,同时发送 HTTP 请求以在网络上进行更深入的搜索。可以将不同的结果拼接在一起以获得越来越清晰的答案,或者只能合并新的例外。

极端边缘设备可以应用其 CPU 资源在本地相关数据库上进行搜索以提高速度。然后使用 APU 密度乘数可以让 Elasticsearch 网络请求在边缘服务器或聚合器上高效运行,而不是发送到云端。考虑可以做出自主决策但仍能从上游更深层次搜索中获得备份验证或路线修正的机器人。考虑根据规则集和当地条件立即做出决策的自动车辆,同时通过高速公路标志网关发送信息并返回上游道路信息和驾驶指令。

展望未来,看到这种融合将带来哪些新机遇将是令人兴奋的。


物联网技术

  1. 第四次工业革命
  2. 融合技术支持十亿级 Elasticsearch
  3. 物联网民主化
  4. 5 连接趋势
  5. 前 10 名 IIoT 平台
  6. 数据中心的未来
  7. 塑造下一代供应链的四项技术
  8. 对新兴技术、边缘和物联网的思考
  9. 工业 4.0 技术:制定数字战略的技巧
  10. 新兴工业 4.0 技术与实际示例
  11. 在实施新技术之前建立制造数据基线的力量
  12. 工业应用中的机器健康和资产监控:传感器技术概览