根据用户应用程序要求改写数据质量规则的方法和系统技术方案

技术编号:8300743 阅读:166 留言:0更新日期:2013-02-07 04:07
本发明专利技术涉及根据用户应用程序要求修改数据质量规则的方法和系统。在把数据质量规则应用于从数据源获得的数据集期间,连同一组公共规则一起,从数据源取回数据,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据。利用至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供指定应用程序使用的一组修改的数据质量规则。所述一组修改的数据质量规则被应用于取回的数据。

【技术实现步骤摘要】

本专利技术的各实施例涉及当从一个或多个数据源提取数据时,建立数据质量的规则。
技术介绍
当把数据从一个或多个数据源加载到系统中,供应用程序之用时,数据一般必须 经历某种数据质量分析和/或数据清理,以确保数据适合于供应用程序使用。根据将使用数据的特定应用程序,对相同数据的数据质量要求可不同(例如,不同的客户端和/或客户端的不同部分可能对数据质量有不同的要求)。然而,尽管能够建立确保提供具有某种格式的数据的某些通用数据质量规则,不过这些规则通常是用与应用程序相关的逻辑或者在从数据源提取数据的系统源设定和建立的。改变一些或者所有的数据质量规则一般要求应用程序或者源系统代码的改变。因此,一般不能在运行时修改数据质量规则,而是需要在数据处理循环期间评估数据质量规则,然后只在处理循环之后进行所述改变。由于适用于一个应用程序的具体规则可能不适用于另一个应用程序,因此难以为从一个或多个数据源取回数据的许多应用程序确保严格的数据质量。
技术实现思路
在本专利技术的一个例证实施例中,提供一种用于对从至少一个数据源获得的数据集应用数据质量规则的计算机实现方法。所述方法包括连同一组公共规则一起,从所述至少一个数据源取回数据,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据,利用至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供指定应用程序使用的一组修改的数据质量规则,和把所述一组修改的数据质量规则应用于取回的数据。在本专利技术的另一个例证实施例中,提供一种用于对从至少一个数据源获得的数据集应用数据质量规则的系统。所述系统包括连同一组公共规则一起,从所述至少一个数据源取回数据的源系统,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据,和从所述源系统接收取回的数据和一组公共规则的客户端。所述客户端包括微件模块,所述微件模块包含至少一个可编辑微件,以及所述客户端还配置有逻辑模块,用于利用所述至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供客户端的指定应用程序使用的一组修改的数据质量规则,和把所述一组修改的数据质量规则应用于取回的数据。在本专利技术的另一个例证实施例中,提供一种用于对从至少一个数据源获得的数据集应用数据质量规则的计算机程序产品。所述计算机程序产品包括具有在其中具体化计算机可读程序代码的计算机可读存储介质。所述计算机可读程序代码被配置成连同一组公共规则一切,接收从所述至少一个数据源取回的数据,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据,利用至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供指定应用程序使用的一组修改的数据质量规则,和把所述一组修改的数据质量规则应用于取回的数据。当考虑以下详细说明,尤其是当结合附图考虑以下详细说明时,本专利技术实施例的以上和另外的特征和优点将变得明显,附图中,各个图中的相同附图标记表示相同的组件。附图说明图I是按照本专利技术的取回实现可单独调整的数据质量规则的数据的系统的例证实施例的示意图。图2描述用于根据应用程序和/或用户规范,改写特定客户端应用程序的数据质量规则的例证微件的⑶I图像。图3是图解说明按照本专利技术的例证实施例,生成微件的方式的流程图。图4是表示按照本专利技术的例证实施例,对一组数据应用数据质量规则,以便生成·微件的示意图。图5是图解说明按照本专利技术的例证实施例的图I的系统的操作,包括定制微件以改写一组通用数据质量规则,从而供客户端应用程序使用的方式的流程图。图6描述按照本专利技术的例证实施例,与微件相关的⑶I图像,所述⑶I图像可以允许修改/定制与所述微件相关的数据质量规则。具体实施例方式本专利技术的实施例提供把数据质量规则应用于从数据源获得的数据集。连同一组公共规则,从数据源取回数据,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据。利用至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供指定应用程序之用的一组修改的数据质量规贝U,然后把所述修改的一组数据质量规则应用于取回的数据。本专利技术的实施例便于修改或定制可用于不同客户端系统的每个不同应用程序的一组公共数据质量规则。图I中描述了实现本专利技术的特征的系统的例证实施例。系统包括通过源系统(在图I中称为数据质量规则数据库12),从一个或多个数据源6、8、10访问数据的多个客户端2、4。虽然图I中只示出了两个客户端2、4和三个数据源6、8、10,不过注意这只是简单表示,并且所述系统并不局限于所述数字。相反,可以为系统提供任何适当数目的客户端和数据源。质量规则数据库12被配置成根据来自客户端2、4的数据查询,从数据源6、8、10取回或提取数据,然后把数据提供给请求所述数据的客户端(例如,通过任何适当的提取、传送和加载处理)。数据库12还包括任何适当数目的不同类型或不同组的公共或通用数据质量规则,所述数据质量规则在数据被提供给进行查询的客户端之前,根据选择的规则类型,对数据应用统一的规则。一组公共规则包括固定的并且适合于为向数据源请求数据的每个客户端,以相同方式提取和格式化所述数据的规则。客户端2、4,数据质量规则数据库12和数据源6、8、10可以相互远离,并通过直接连接或者任何适当的网络通信(如图I中所示的不同系统组件之间的箭头所示)。例如,可以实现网络,以便于利用任何适当的通信媒体(例如,广域网(WAN)、局域网(LAN)、因特网、企业内部网等),在两个或更多个系统组件之间传送任何类型的数据和/或其它信息。另一方面,客户端2、4,数据质量规则数据库12和数据源6、8、10中的一个或多个可以彼此在本地,并通过任何适当的本地通信媒体(例如,局域网(LAN)、硬连线、无线链路、企业内部网等)通信。此外,客户端2、4,数据质量规则数据库12和数据源6、8、10中的任意两个或更多个,和移植数据库4可被实现成单一系统组件内的子组件。客户端2、4,数据质量规则数据库12和数据源6、8、10都可以用任何常规的或者其它计算机系统实现,所述计算机系统可以配备提供图形用户界面或其它界面(例如,提供命令行提示、微件和/或其它菜单屏幕等),以向用户请求与期望数据和分析有关的信息的显示器或监视器,基本部分(例如包括处理器、存储器和/或内部或外部通信装置(例如,调制解调器、网卡等)),可选输入装置(例如,键盘、鼠标或其它输入装置),和任何可从市场上获得和/或定制的软件(例如,服务器/通信软件、分析和/或其它类型的模块、浏览器/界面软件等)。数据质量规则数据库包括数据质量规则模块14,在数据被提供给客户端之前,可从数据质量规则模块14对从数据源取回的数据应用一组公共的数据质量规则。数据质量规则模块14可以包括将根据对特定应用程序和/或根据数据查询取回的特定多列数据或 者数据记录的要求,应用于数据的所选数目的不同多组预定数据质量规则。数据质量规则可以是将对数据进行的任何系列的逻辑运算,比如将应用于数据的约束,或者将对数据采取的动作(例如,根据规则内被满足的条件,对数据的修改)。在例证实施例中,从数据源内的表格获得的记录的一列本文档来自技高网...

【技术保护点】
一种用于对从至少一个数据源获得的数据集应用数据质量规则的计算机实现方法,包括:连同一组公共规则一起,从所述至少一个数据源取回数据,所述一组公共规则被配置成以按照该组公共规则中的一条或多条预定的数据质量规则的方式,格式化取回的数据;利用至少一个可编辑微件,调整至少一条预定的数据质量规则,以形成适合于供指定应用程序使用的一组修改的数据质量规则;和把所述一组修改的数据质量规则应用于取回的数据。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:M·N·达尼A·古普塔M·K·莫哈尼亚G·温卡塔查利亚赫
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1