【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请根据35U.S.C.§119(e)要求先前提交日期的权益,如下:·在2013年3月15日提交的,名称为“SYSTEMFORANALYZINGANDUSINGLOCATIONBASEDBEHAVIOR”的美国临时申请No.61/799,986;·在2013年3月15日提交的,名称为“GEOGRAPHICLOCATIONDESCRIPTORANDLINKER”的美国临时申请No.61/800,036;·在2013年3月15日提交的,名称为“SYSTEMANDMETHODFORCROWDSOURCINGDOMAINSPECIFICINTELLIGENCE”的美国临时申请No.61/799,131;·在2013年3月15日提交的,名称为“SYSTEMWITHBATCHANDREALTIMEDATAPROCESSING”的美国临时申请No.61/799,846;以及·在2013年3月15日提交的,名称为“SYSTEMFORASSIGNINGSCORESTOLOCATIONENTITIES”的美国临时申请No.61/799,817。本申请同样涉及:·在同一日期与此一道提交的,名称为“APPARATUS,SYSTEMS,ANDMETHODSFORANALYZINGMOVEMENTSOFTARGETENTITIES”的美国专利申请No.14/214,208;·在同一日期与此一道提交的,名称为“APPARATU ...
【技术保护点】
一种设备,包括:处理器,其被配置成运行存储在存储器中的一个或多个模块,其中所述一个或多个模块被配置成:识别针对其确定相似性值的至少一对数据记录;至少部分地基于与所述至少一对数据记录相关联的多个属性,确定所述至少一对数据记录的所述相似性值;以及基于所述至少一对数据记录的所述相似性值,将所述至少一对数据记录与一个或多个集群相关联,每个所述集群均与唯一实体相关联。
【技术特征摘要】
【国外来华专利技术】2013.03.15 US 61/799,131;2013.03.15 US 61/799,817;1.一种设备,包括:
处理器,其被配置成运行存储在存储器中的一个或多个模块,其中所
述一个或多个模块被配置成:
识别针对其确定相似性值的至少一对数据记录;
至少部分地基于与所述至少一对数据记录相关联的多个属性,
确定所述至少一对数据记录的所述相似性值;以及
基于所述至少一对数据记录的所述相似性值,将所述至少一对
数据记录与一个或多个集群相关联,每个所述集群均与唯一实体相关
联。
2.根据权利要求1所述的设备,其中所述一个或多个模块进一步被配
置成基于可能由相关数据记录共享的一组预定属性,识别不需要针对其确
定相似性值的一对或多对数据记录。
3.根据权利要求2所述的设备,其中所述一个或多个模块被配置成基
于来自先前迭代的数据记录与集群的关联,调节所述一组预定属性。
4.根据权利要求1所述的设备,其中所述一个或多个模块被配置成基
于从训练数据记录得知的相似性函数,确定所述相似性值。
5.根据权利要求4所述的设备,其中所述相似性函数被设计成推断与
数据记录的特定属性相关联的特定组件的重要性,其中通过如下操作得知
所述相似性函数:
确定在与所述训练数据记录的所述特定属性相关联的组件之间的差
异,其中已知所述训练数据记录属于同一集群;以及
基于所述特定组件在所述差异中出现的次数,确定所述特定组件的重
要性。
6.根据权利要求4所述的设备,其中所述相似性函数被设计成推断将
数据记录的特定属性中的第一组件与第二组件互换的可能性,其中通过如
下操作得知所述相似性函数:
确定在与所述训练数据记录的所述特定属性相关联的组件之间的差
异,其中已知所述训练数据记录属于同一集群,以及
基于所述第一组件和所述第二组件同时在所述差异中出现的次数,确
定将所述第一组件与所述第二组件互换的可能性。
7.根据权利要求4所述的设备,其中所述相似性函数被设计成确定数
据记录的缺失属性具有特定组件的条件可能性,其中通过如下操作确定所
述条件可能性:
确定对应于特定实体的已知属性的组合;
确定缺失属性在具有所述已知属性的组合的特定实体的数据记录之
间的所有变化;以及
假定所述数据记录具有已知属性的特定组合,基于所述缺失属性的所
述变化来确定所述缺失属性具有特定组件的条件概率。
8.根据权利要求1所述的设备,其中所述一个或多个模块被配置成:
将多个数据记录表示为图中的多个节点;
将所述至少一对数据记录的所述相似性值表示为图中对应于所述至
少一对数据记录的节点之间的至少一个边;以及
基于所述图确定所述一个或多个集群。
9.根据权利要求8所述的设备,其中所述一个或多个模块被配置成基
于所述图,使用图聚类技术来确定所述一个或多个集群。
10.根据权利要求1所述的设备,其中所述一个或多个模块被配置成
接收要求所述一个或多个模块将两个数据记录与同一集群相关联的聚类
指令。
11.根据权利要求1所述的设备,其中所述一个或多个模块被配置成
使用聚类技术将所述多个数据记录中的至少一个关联到一个或多个
集群;以及
基于所述一个或多个集群中的数据记录,独立地调节针对所述一个或
多个集群中的...
【专利技术属性】
技术研发人员:B·西马诺夫斯基,M·拉冈,L·保罗维兹,
申请(专利权)人:美国结构数据有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。