数据质量——引爆点 (Parvathy Menon)

数据质量——引爆点 (Parvathy Menon)

数据质量 – 引爆点 (Parvathy Menon) PlatoBlockchain 数据智能。垂直搜索。人工智能。

“数据是一种宝贵的东西,比系统本身的寿命更长。” 这么说

蒂姆·伯纳斯 - 李
,万维网的发明者。 “珍贵”的前提是数据确实值得信赖,并且质量可靠且始终如一。 客户无可争议地承认数据质量确实构成了他们所有数据管理和分析驱动计划的基础

但是,为什么围绕数据质量和围绕它开展的工作会引起如此大的轰动。 . 经常让客户感到困惑的是,数据生命周期每个阶段的检查点都非常庞大。 通过客户在其系统环境中拥有的一系列数据管理解决方案,即。 数据仓库、数据集市、主数据管理解决方案、数据湖等,似乎对数据质量的方法存在一定程度的不确定性和怀疑。

而且,如果要查看数据生命周期的范围,质量问题可能会出现在每一个关键时刻,从源头到 ETL 或任何中间件转换到全球统一的数据仓库和数据湖,直到它最终以某种形式的报告分析、用户屏幕等及其轰动吸引了最终用户或客户!

因此,在企业内部存在的各种数据和系统中,是否存在关于在何处以及如何解决数据质量问题的硬性规定。 好吧,我们的愿望清单上有很多。 但是,如果希望是马……数据质量计划的唯一目的应该是确保神圣不可侵犯的数据可用于所有适用的业务流程,无论是内部还是外部消费者。

以下是可帮助引导组织的数据质量愿景的关键指南列表:

对数据进行分类和优先级排序:

在可用的各种类型的数据中,即。 主数据、交易/运营数据、参考数据、分析数据,可能会迫切要求在运营或分析系统范围内清理数据,因为这是用户访问/使用数据的最近位置,但称其为短期解决方案是一种轻描淡写的说法,因为毕竟人们只是在问题出现时处理它,而不是真正解决它的核心问题。 相反,更有意义的是查看确实在企业范围内使用的数据类别,这些数据就是您的客户、产品、供应商、员工、资产和位置等主业务实体。因此清理、丰富应用于主数据的匹配和生存过程可用于创建主记录的最佳版本,从而提供关键业务实体的单一、统一和一致的视图。

 在生命周期的早期应用检查:

尽可能靠近源头清理数据,现在这是一个基本的最佳实践,当然也是垃圾进出的情况。在靠近源头或就此而言,解决数据质量问题始终是更好的策略来源本身,因为这可以为您节省很多精力和费用。 尽管您可以尝试清理和标准化源系统中的数据,但您宁愿在输入之前进行检查,以避免事后清理的需要

 不同的问题不同的延迟:

一个组织的某些关键流程可能需要实时数据质量检查,这是不可避免的,以避免任何欺诈或口是心非的活动。 示例是任何银行交易。 与影响较小的业务流程相反。 在这两种情况下,尽管您可能会应用数据质量管理的原则,但您需要认识到紧迫的需求与其他需求,并相应地处理任务

每个阶段的业务包容性:

业务利益相关者在数据质量之旅中的参与再怎么强调也不为过。 从 DQ 之旅(即质量评估)开始到清理和删除重复数据,业务方面的参与度非常高。 不用说,企业对数据质量计划的承诺和赞助意味着其成功的可能性

 建立闭环修复流程:

这种持续不断的评估、清理、组织活动将确保数据始终适合目的和使用,而不是进行一次性活动或对错误报告或升级进行报复

 采用敏捷冲刺:

可以将敏捷和 DQ 的结合称为天作之合。 在数据质量计划中采用敏捷方法可以在很大程度上帮助减少因利益相关者的延迟反馈而产生的延迟。 DQ 中的敏捷方法有助于加速整个过程,因为业务利益相关者可以扮演产品经理的角色,此外,由于冲刺将专注于特定的业务领域,它可以实现更快的分析,从而更快地得出结果(阅读敏捷中的价值)

 利用工具集:

从不同的系统捕获大量数据并尝试分析数据以释放其真正价值对于分析师来说可能是一项艰巨的任务,因为该过程不仅手动繁琐,而且时间效率低下且容易出错。 有大量可用于数据分析和清理、数据整理的工具集,企业必须投资正确的工具,使企业能够以最佳方式真正提供有价值的见解

 

持续关注数据质量值得每一分钱的投资,因为它不仅有助于灌输企业对数据的信心,还有助于收获所有其他现有企业解决方案的好处 

时间戳记:

更多来自 芬泰达