模糊数据操作制造技术

技术编号：7154821 阅读：241 留言：0更新日期：2012-04-11 18:40

一种用于对存储在数据存储系统中的数据元素进行聚类的方法包括从数据存储系统读取数据元素。形成数据元素的聚类，其中，每一个数据元素是至少一个聚类的成员。将至少一个数据元素与两个或多个聚类相关联。该数据元素的属于所述两个或多个聚类的各自一个的成员资格由不明确性度量表示。将表示所形成的聚类的信息存储在数据存储系统中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本描述涉及数据管理领域中的模糊数据操作。
技术介绍
在数据管理中采用例如聚类(cluster)、联接(join)、搜索(search)、上卷 (rollup)和排序(sort)的数据操作来处理数据。聚类是将数据分类为不同组的操作。联接将两片数据组合在一起。通过关键字(key)的搜索找到与该关键字匹配的数据条目。上卷跨过(across) —组数据计算一个或多个层次的子和(subtotal，或者其他组合)的操作。排序是对数据安排顺序(order)的操作。在数据管理中数据质量很重要。由数据操作导致的错误或者不准确使数据质量退化。例如，将ABC公司的雇员John Smith分类为临时工作人员或者永久工作人员使John Smith享有不同级别的福利(benefit)。对John Smith的雇佣状态的错误分类，例如数据操作聚类中的错误，影响ABC公司的人力资源数据的质量。数据操作的某些实施方案依靠字段值(“关键字(key) ”)的精确比较来标识匹配的记录、定义相关记录的组或者链接记录。当数据有不明确性(ambiguous)、不精确、不完整或者不确定时，基于字段值的精确比较的方法可能失效。当存在与例如聚类的数据操作相关联的内在(inherent)不明确性时，一种解决不明确性的方法可以是简单地忽略不明确性并强制一片数据进入特定组中。例如，ABC公司的雇员John Smith既为营销部门工作也为研发部门工作。在ABC公司的人力资源数据库中，John Smith可以与营销部门或研发部门相关联，但是经常只和一个部门相关联。将该片数据强制分类到特定组可能掩盖内在不明确性并...

【技术保护点】
１．一种用于对存储在数据存储系统中的数据元素进行聚类的方法，所述方法包括：从数据存储系统（１２）读取数据元素（１２０）；形成数据元素的聚类（１２２），每一个数据元素是至少一个聚类的成员；将至少一个数据元素与两个或多个聚类相关联，所述数据元素的属于所述两个或多个聚类的各自一个的成员资格由不明确性度量表示；以及将表示所形成的聚类的信息存储在数据存储系统（１２）中。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：阿伦安德森，
申请(专利权)人：起元技术有限责任公司，
类型：发明
国别省市：US

全部详细技术资料下载我是这个专利的主人