实时数据准确性在您的业务中的重要性
获取准确的实时数据对业务至关重要。它需要使用元数据识别模式,通过元数据文件对这些信息进行分组,并通过元数据管理框架确保元数据的准确性。
考虑实时数据准确性,这是一种涉及正确值和格式的数据质量特征,这是盈利和不断发展的业务的必要条件。公司需要准确的实时数据来应对消费者需求的涌入。三分之一的高管和财务专业人士同意,他们越来越重视实时财务数据。
不幸的是,许多组织仍在努力从实时数据中获取业务洞察力。公司会收集数小时的流式数据馈送,但可能只需要几分钟的时间就可以做出正确的决定。
即使决定如何验证积累的数据量,也会在快速确定一个数据集是否比另一个数据集更准确方面带来挑战。打错电话,导致企业亏损 1400 万美元。
幸运的是,元数据,即有关数据的数据,有望帮助获得实时数据的准确性。本文将带领读者踏上使用元数据获取实时数据准确性的旅程。
使用元数据验证实时数据准确性
谈论生成更多数据以帮助保持现有数据的准确性似乎违反直觉。但是元数据有几个超能力:
- 如果准确,元数据会提供有关其描述的信息的上下文,从而证明数据的准确性。计算机程序可以将此元数据转换为模式或表示。
- 元数据定义包含数据集的技术、业务或运营描述的任意组合。因此,系统、流程或人员可以使用元数据来表征客户、购买、产品、位置等,
- 算法可以使用技术元数据来标记另一个进程或人员以采取进一步的行动。
- 元数据可以包裹大量数据,使这些数据更易于查找。
两位专家 Romero 和 Calders 通过一种称为信息剖析的方法利用了这些元数据优势。他们提出了一个框架,应用元数据形成一个用于分析的模式,然后使用元数据封装结果。
进一步了解这些发现,公司可以使用他们的业务规则来指导模式的元数据形成,并将数据分组到由元数据包装的数据包中。这些组织将有一种更有效的方式来处理实时数据,方法是使用算法来查找数据模式并检索匹配的数据集。
探索实时数据准确性示例
在现实生活中如何使用元数据来实现实时数据准确性?来自巴布森学院的 Gordon 和 Shankaranarayanan 提供了见解。
假设 A 公司的订阅源每小时有数百条即时消息传入。一位名叫 John Doe 的客户发短信说他想从 A 公司购买一辆自行车。A 公司想要验证这些消息来自 John Doe,并且他想购买一辆自行车。
首先,应用程序将创建一个 John Doe 个人资料,即关于 John Doe 的元数据。假设有关 John Doe 的元数据具有基于电话号码、使用的手机类型和 A 公司的会员身份的值。这种 John Doe 表示将很好地作为 A 公司客户关系管理系统中包含的数据。
然后一个计算机程序获取这个 John Doe 配置文件并将其与提要中的文本流进行匹配,并使用业务规则定义要在数据流中查找的内容。一旦软件看到与 John 的模式 Doe 匹配的数据,它就会将其捆绑在一个内容元数据文件下。此内容元数据文件可供人们搜索,并确保短信来自 John Doe(如果元数据质量满足业务需求)。
此外,算法将汇总购买资料,以确定 John Doe 购买自行车的可能性,例如亚马逊如何确定向其客户推荐哪些产品。然后,算法可以应用此购买配置文件并衡量约翰想要购买自行车的可能性。
使元数据准确性至关重要
请注意,使用元数据创建模式和批处理在很大程度上取决于元数据的准确性。否则无法保证实时数据的准确性。
在上面的示例中,如果 John Doe 更改了他的电话号码,而他的元数据仍然是旧电话号码,那么 John 的元数据将不准确。同样,需要正确标记具有实时数据集的元数据文件。如果包含 John Doe 文本文件的元数据包含错误的客户姓名,则人们将找不到 John 的文本文件。
因此,公司用于监控和清理数据以始终如一地提供高质量数据的相同原因和流程也适用于元数据。用于实时验证的元数据必须足够准确,才能对实时数据的准确性有信心。
元数据管理框架
那么自动化元数据监控和清理就足够了吗?否。获得足够的元数据质量以对业务有价值和可访问取决于元数据管理框架。
组织的人员、流程和技术构成了这个元数据管理框架和创建它的业务规则。
例如,如果一个部门在一个系统中将其客户名称标准化,而另一个部门在一个单独的应用程序中以不同的方式格式化客户名称,那么它的元数据管理框架就会不稳定。组织从哪个部门获取元数据来使用?
开发元数据管理框架以确保足够的实时数据准确性需要:
- 元数据管理评估存在哪些结构及其影响。根据这个基线,公司可以确定要更改哪些流程。
- 数据战略,一种利用数据保持业务发展的计划。
- 数据治理是一项协调元数据访问和安全性的计划,以保持合规性。
- 全面了解元数据在确定实时数据准确性方面的重要性和价值。此外,工作人员需要知道如何定义好的元数据。
- 关于哪些属性和值定义元数据描述的内容或对象的可靠业务需求。
最后的话
2020 年,公司看到了为什么他们需要实时数据质量,同时对从这些数据中获取业务洞察力持怀疑态度。高数据量和数据速度为企业快速确保每条数据在文本或消息流中的准确性带来了重大障碍。
使用元数据模式和业务规则管理实时数据可以获得更多价值,同时节省公司资源来分析不相关的数据。使用元数据对结果进行分块并标记这些数据集可以更快地找到准确的数据。但是以这种方式使用元数据需要准确的元数据和足够的元数据管理结构,以便业务对其实时数据准确性充满信心。
物联网技术