物联网和云计算是数据的未来吗?
预计到 2022 年将有 290 亿台联网设备投入使用——预计到 2025 年全球将有超过 750 亿台物联网 (IoT) 设备投入使用——物联网是具有前瞻性思维的企业的主要考虑因素。
Unravel Data .然而,随着企业部署越来越多的智能设备,产生的数据量也在增加,集中式云系统将在确保这些洞察力得到智能利用方面发挥重要作用。因此,物联网的激增带来了相当大的 DataOps 挑战。
数据处理困难
大量物联网设备带来了大量和类型的数据。例如,物联网设备可以提供多种多样的数据类型:客户销售额、行驶里程、GPS 坐标、湿度、在场人数、车速、温度和空气质量。许多企业难以处理由物联网创建的复杂性和海量数据,并且发现他们的数据管道效率低下。对于依赖实时流式传输的应用驱动服务,这是一个重大问题。
为此,需要个性化、实时、流媒体应用程序,如 Kafka、Spark、Kudu、Flink 或 HBase,来管理现代云交付服务的大量大数据需求。话虽如此,分析流媒体流量数据并生成统计特征需要复杂且消耗资源的监控方法。
尽管分析人员可以对传入的数据同时应用多种检测方法,但这不可避免地会导致复杂性和性能挑战。当应用程序跨越多个系统时尤其如此(例如,与 Spark 交互进行计算,与 YARN 进行资源分配和调度,使用 HDFS 或 S3 进行数据访问,或使用 Kafka 或 Flink 进行流传输)。如果这些部署包含独立的、用户定义的程序,如多个应用程序中常见的重复数据预处理或特征生成,它们会变得更加复杂。
物联网爆炸式增长
为了创建维持物联网设备爆炸性增长所需的云基础设施,当前的数据管理工具和流程无法胜任。为了应对大量物联网设备带来的挑战,许多企业开始意识到对 AI 或 ML 集成的需求。
这些集成通过启用智能数据操作来减轻手动排序数据的负担,从而增强了数据团队理解所有这些数据的能力。这有助于将数据更快地路由到正确的位置、跟上业务需求并维持其数据操作的实时元素。
通常在这些场景中,流应用程序在实时处理数据方面可能会滞后,对于这样一个复杂的系统来说,确定根本原因可能是一项繁琐的挑战。因此,与替代方案相比,依赖机器学习和人工智能 (AI) 的数据部署更有可能提供所需的性能、可预测性和可靠性。
为了能够从物联网设备高效、持续地收集数据,机器学习算法已被证明在审查应用程序执行、识别潜在故障的原因以及生成提高性能和资源使用率的建议方面至关重要。另一个关键好处是,实施此类流程可以让组织享受更低的成本和更高的可靠性。
考虑每个用例
因此,关键是要考虑每个单独的用例,并了解它为哪些特定的物联网挑战提供了答案。通过首先了解环境及其给各自组织带来的问题,IT 团队能够更快地实施必要的解决方案。无论是机器学习还是人工智能,交付基于物联网的部署取决于通过自动化增强数据团队以管理出现的复杂性。
作者是 Unravel Data 的首席技术官 Shivnath Babu。
物联网技术