【技术实现步骤摘要】
用于基于知识的数据质量解决方案的域
本专利技术一般涉及数据质量,尤其涉及基于知识的数据质量方案。
技术介绍
随着计算技术的提高以及计算设备变得更普遍,出于个人和公务原因使用计算机对于日常活动已经变得常见。为了跟上需求,数据集合呈指数级增长。数据集合以及数据的后续处理的目的在于理解所收集数据的意义,并出于有用的目的汇编所搜集的数据。与数据的累积以及数据的任何相应使用相关联的问题在于数据内包含的错误(例如低质量数据)。错误的示例可包括不正确的数据、缺失的数据、拼写错误、误置数据、重复数据、以及其它问题。依赖含错误数据的人和公司可基于该数据作出决定、分析、和/或其它动作,并且如果该数据有缺陷,则所得到的决定、分析等等也会是有缺陷的。如果事后发现错误,则会损坏数据的置信度和相关信任。在一些情形中,如果数据不满足足够的质量水平,则该数据可能无法加以信赖。一些系统利用一般方法来改进数据质量。该一般方法基于“一视同仁”(one-size fits all)的思想。例如,该一般方法对数据应用一般算法,以尝试净化或改进数据的质量。 由于一般算法是不管数据内容为何就应用的,因此一般方 ...
【技术保护点】
一种用于数据质量解决方案的系统,包括:配置成采集关于第一数据集和第二数据集的数据信息的访问模块(340);配置成针对所述第一数据集和所述第二数据集创建一个或多个域的域创建模块(385);以及配置成集聚所述一个或多个域并用集聚后的域填充知识库(330)的编译模块(390),其中所述知识库(330)用于处理一个或多个数据质量集。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:J·玛尔卡,E·齐克利克,E·胡迪斯,M·拉维夫,G·皮莱格,D·法伊比希,
申请(专利权)人:微软公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。