当前位置: 首页 > 专利查询>微软公司专利>正文

用于基于知识的数据质量解决方案的域制造技术

技术编号:8453042 阅读:165 留言:0更新日期:2013-03-21 17:08
本发明专利技术涉及基于丰富知识库的知识驱动的数据质量解决方案,具体为用于基于知识的数据质量解决方案的域。该数据质量解决方案可提供连续的改进,并且可基于连续(或持续)的知识采集。该数据质量解决方案可建立一次,且可重新用于多次数据质量提高,其可针对相同数据或相似数据。所公开的各个方面容易使用且集中于生产力和用户体验。此外,所公开的各个方面是开放和可扩展的,且可应用于基于云的参考数据(例如第三方数据源)和/或用户生成的知识。根据一些发明专利技术,所公开的各个发明专利技术可与数据集成服务集成。

【技术实现步骤摘要】
用于基于知识的数据质量解决方案的域
本专利技术一般涉及数据质量,尤其涉及基于知识的数据质量方案。
技术介绍
随着计算技术的提高以及计算设备变得更普遍,出于个人和公务原因使用计算机对于日常活动已经变得常见。为了跟上需求,数据集合呈指数级增长。数据集合以及数据的后续处理的目的在于理解所收集数据的意义,并出于有用的目的汇编所搜集的数据。与数据的累积以及数据的任何相应使用相关联的问题在于数据内包含的错误(例如低质量数据)。错误的示例可包括不正确的数据、缺失的数据、拼写错误、误置数据、重复数据、以及其它问题。依赖含错误数据的人和公司可基于该数据作出决定、分析、和/或其它动作,并且如果该数据有缺陷,则所得到的决定、分析等等也会是有缺陷的。如果事后发现错误,则会损坏数据的置信度和相关信任。在一些情形中,如果数据不满足足够的质量水平,则该数据可能无法加以信赖。一些系统利用一般方法来改进数据质量。该一般方法基于“一视同仁”(one-size fits all)的思想。例如,该一般方法对数据应用一般算法,以尝试净化或改进数据的质量。 由于一般算法是不管数据内容为何就应用的,因此一般方法仅能提供有限的解决本文档来自技高网...
用于基于知识的数据质量解决方案的域

【技术保护点】
一种用于数据质量解决方案的系统,包括:配置成采集关于第一数据集和第二数据集的数据信息的访问模块(340);配置成针对所述第一数据集和所述第二数据集创建一个或多个域的域创建模块(385);以及配置成集聚所述一个或多个域并用集聚后的域填充知识库(330)的编译模块(390),其中所述知识库(330)用于处理一个或多个数据质量集。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:J·玛尔卡E·齐克利克E·胡迪斯M·拉维夫G·皮莱格D·法伊比希
申请(专利权)人:微软公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1