用于数据质量监控的系统和方法技术方案

技术编号：8161463 阅读：148 留言：0更新日期：2013-01-07 19:29

本发明专利技术公开了用于数据质量监控的系统和方法。数据质量监控指的是相对于预定数据质量度量来测量加载的数据的数据质量。通过把在质量规则中定义的逻辑演算应用于加载的数据来测量数据质量。利用以下至少之一来进行数据质量测量：加载的数据的增量变化和质量规则的增量变化。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般涉及ETL(提取-转换-加载)过程期间的数据剖析方法，更具体地说，涉及通过运行数据质量规则并对照先前的结果比较数据质量规则来确定数据质量是提高了还是降低了的数据质量监控。
技术介绍
目前，在用于诸如主数据管理(MDM, master data management)、数据仓储(DW,data warehousing)、业务应用整合等的数据集成项目中，利用ETL (提取-转换-加载)过程中的数据剖析技术和/或数据清理方法来识别数据质量问题，使得在这些系统的初始加载阶段期间，只加载高质量的数据。然而，在数据质量问题正在变成企业的成本因素或者甚至完全中断业务过程的业务应用中，数据质量退化。在这些应用系统中，利用数据质量规则定期地测量数据质量是检测退化的速度或者数据质量随着时间的变化以及如果某些最低限度要求的数据质量关键性能指标(KPI)不再被满足而采取行动的动机的唯一途径。对于比如MDM的解决方案来说，除了 MDM系统的部署之外，还建立数据支配(DG，datagovernance)程序以控制主数据的创建、维护和使用以及在其整个生命周期内的主数据质量。在数据支配组织中工作的数据专员定期应用数据剖析测量来控制与主数据的数据质量KPI—致。测量通常是利用语义规则(多种数据剖析技术之一)来进行的。定义数据质量KPI、语义规则、创建初始加载期间的第一基线测量、定期执行这些规则、以及对照基线结果进行比较的步骤被称为数据质量监控。数据剖析和数据质量监控是I/O密集操作，并且非常费时。因此，对数据质量剖析和数据质量监控来说，可选的是把数据提取到中转区中，以避免...

【技术保护点】
一种计算机实现的方法，通过相对于预定的数据质量度量测量加载的数据的数据质量来监控数据质量，其中，通过把在质量规则中定义的逻辑演算应用于加载的数据来测量数据质量，所述方法包括：利用加载的数据的增量变化和/或质量规则的增量变化来进行数据质量测量。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：M·奥伯霍菲尔，J·塞弗特，Y·赛勒特，S·尼尔克，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人