一种企业重名人区分方法及装置制造方法及图纸

技术编号:16546863 阅读:23 留言:0更新日期:2017-11-11 11:41
本发明专利技术提供一种企业重名人区分方法及装置。所述方法包括:获取与待查询人名相关联的企业集合;获取所述企业集合的人名‑企业关联关系表;根据所述人名‑企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。本发明专利技术实施例提供的企业重名人区分方法及装置,将与待查询人名相关联的每个企业向量化,生成对应的企业向量,根据企业向量的聚类结果生成待查询人名的企业子集合,使同一企业子集合所对应的待查询人名为同一个自然人,从而将企业重名人进行区分,并且可以直观地看出每个自然人所对应的企业,以便进行各种后续分析及调查。

A method and device for distinguishing celebrities from enterprises

The invention provides a method and device for distinguishing celebrities from enterprises. The method comprises: obtaining related query names linked set of enterprise; enterprise association table names gets the set of enterprises; according to the relation table of the names of enterprises, enterprises of the enterprise each vector generation enterprise set corresponding to the enterprise; vector clustering, generating the query the names of the enterprises set. Heavy celebrity enterprises the embodiment of the invention provides a method and a device for distinguishing, related to the query name associated with each enterprise to generate the corresponding vector quantization, the enterprise, according to the results of cluster enterprise vector generation enterprise name query sub set, so that the same enterprise subset corresponding to the query names for the same a natural person, which will be enterprise celebrity to distinguish, and can visually see each natural person of the enterprise, in order to carry out a variety of subsequent analysis and investigation.

【技术实现步骤摘要】
一种企业重名人区分方法及装置
本专利技术涉及信息检索
,具体涉及一种企业重名人区分方法及装置。
技术介绍
在日常生活中,人们经常需要查询某些人作为高管、法人等的公司信息,以便进行后续的各种分析和调查。然而在进行企业信息检索查询时,经常遇到相同人名的情况。例如,在企业信息检索库中查询“张三”作为高管的公司,检索结果可能出现X公司、Y公司、C公司等上百家公司,作为这些公司高管的张三可能指代的是不同的自然人。现有的企业信息检索系统无法区分哪些“张三”是同一个自然人,并对应哪些公司,对查询用户造成困扰。因此,对企业重名人进行区分的需求是目前业界亟待解决的重要课题。
技术实现思路
针对现有技术中的缺陷,本专利技术实施例提供了一种企业重名人区分方法及装置。第一方面,本专利技术实施例提供一种企业重名人区分方法,所述方法包括:获取与待查询人名相关联的企业集合;获取所述企业集合的人名-企业关联关系表;根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。第二方面,本专利技术实施例提供一种企业重名人区分装置,所述装置包括:第一获取模块,用于获取与待查询人名相关联的企业集合;第二获取模块,用于获取所述企业集合的人名-企业关联关系表;企业向量化模块,用于根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;聚类模块,用于对所述企业向量聚类,生成所述待查询人名的企业子集合。第三方面,本专利技术实施例提供一种电子设备,包括:存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取与待查询人名相关联的企业集合;获取所述企业集合的人名-企业关联关系表;根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:获取与待查询人名相关联的企业集合;获取所述企业集合的人名-企业关联关系表;根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。本专利技术实施例提供的企业重名人区分方法及装置,将与待查询人名相关联的每个企业向量化,生成对应的企业向量,根据企业向量的聚类结果生成待查询人名的企业子集合,使同一企业子集合所对应的待查询人名为同一个自然人,从而将企业重名人进行区分,并且可以直观地看出每个自然人所对应的企业,以便进行各种后续分析及调查。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的企业重名人区分方法流程示意图;图2为本专利技术实施例提供的企业重名人区分装置的结构示意图;图3为本专利技术实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的企业重名人区分方法流程示意图,如图1所示,所述方法包括:步骤S11、获取与待查询人名相关联的企业集合;具体地,当用户需要查询某个人名所对应的企业时,首先获取与待查询人名相关联的所有企业,上述所有企业组成该待查询人名的企业集合,将上述企业集合记为待查询人名_Com_Set,在实际应用中,与待查询人名相关联的企业可以是待查询人名作为高管和/或法人和/或股东的所有企业,可以通过工商部门提供的信息获取到该待查询人名相关联的所有企业。例如,用户需要查询“张三”所对应的企业,则首先获取“张三”作为高管和/或法人和/或股东的所有企业,例如,“张三”作为高管的企业有X企业和Y企业,“张三”作为法人的企业有X企业和Z企业,“张三”作为股东的企业有X企业和W企业,则与“张三”相关联的企业集合为X企业、Y企业、Z企业和W企业,即“张三”_Com_Set={X,Y,Z,W}。步骤S12、获取所述企业集合的人名-企业关联关系表;具体地,遍历步骤S11中获得的企业集合,根据该企业集合中的每个企业的人名信息和企业信息,生成企业集合的人名-企业关联关系表。例如,遍历上述企业集合“张三”_Com_Set,获取X企业、Y企业、Z企业和W企业的人名信息和企业信息,根据上述信息生成企业集合的人名-企业关联关系表。步骤S13、根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;具体地,根据步骤S12获得的企业集合的人名-企业关联关系表,将企业集合中的每个企业向量化,生成每个企业对应的企业向量。例如,根据企业集合“张三”_Com_Set的人名-企业关联关系表,就可以生成X企业向量、Y企业向量、Z企业向量和W企业向量。步骤S14、对所述企业向量聚类,生成所述待查询人名的企业子集合。具体地,对步骤S13中获得的企业向量聚类,将聚为一类的企业向量所对应的企业作为待查询人名的一个企业子集,直到企业集合中所有的企业都已经被划分到相应的企业子集为止,该待查询人名的所有企业子集组成待查询人名的企业子集合,其中属于一个企业子集的待查询人名对应一个自然人。例如,对上述X企业向量、Y企业向量、Z企业向量和W企业向量进行聚类,若聚类结果为X企业向量、Z企业向量和W企业向量为一类,Y企业向量为另一类,则X企业、Z企业和W企业为一个“张三”的企业子集,Y企业为“张三”所对应的另一个企业子集,则表明X企业、Z企业和W企业所对应的“张三”为同一个自然人,而Y企业所对应的“张三”为另一个自然人,这样就可以很好将“张三”所对应的重名人进行区分,使用户很直观地看到“张三”这个待查询人名实际对应的是两个不同的自然人,并且可以看到每个“张三”所对应的企业。本专利技术实施例提供的企业重名人区分方法,将与待查询人名相关联的每个企业向量化,生成对应的企业向量,根据企业向量的聚类结果生成待查询人名的企业子集合,使同一企业子集合所对应的待查询人名为同一个自然人,从而将企业重名人进行区分,并且可以直观地看出每个自然人所对应的企业,以便进行各种后续分析及调查。在上述实施例的基础上,进一步地,所述获取所述企业集合的人名-企业关联关系表,包括:获取与所述企业集合中每个企业相关联的人名;获取与所述企业集合中每个企业相关联的企业;根据所述每个企业相关联的人名和所述每个企业相关联的企业生成所述每个企业的人名-企业关联关系,根据所述人名-企业关联关系生成所述企业集合的人名-企业关联关系表。具体地,遍历上述企业集合中的每个企业,获取与该企业相关联的人名,例如获取该企业高管、法人、或股东所对应的人名,上述高管、法人或股东可以根据实际情况选择,本专利技术本文档来自技高网...
一种企业重名人区分方法及装置

【技术保护点】
一种企业重名人区分方法,其特征在于,包括:获取与待查询人名相关联的企业集合;获取所述企业集合的人名‑企业关联关系表;根据所述人名‑企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。

【技术特征摘要】
1.一种企业重名人区分方法,其特征在于,包括:获取与待查询人名相关联的企业集合;获取所述企业集合的人名-企业关联关系表;根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量;对所述企业向量聚类,生成所述待查询人名的企业子集合。2.根据权利要求1所述的方法,其特征在于,所述获取所述企业集合的人名-企业关联关系表,包括:获取与所述企业集合中每个企业相关联的人名;获取与所述企业集合中每个企业相关联的企业;根据所述每个企业相关联的人名和所述每个企业相关联的企业生成所述每个企业的人名-企业关联关系,根据所述人名-企业关联关系生成所述企业集合的人名-企业关联关系表。3.根据权利要求2所述的方法,其特征在于,所述根据所述人名-企业关联关系表,生成所述企业集合中每个企业对应的企业向量,包括:获取所述人名-企业关联关系表中的所有人名;获取所述人名-企业关联关系表中的所有企业;根据所述所有人名和所述所有企业生成所述每个企业对应的企业向量,根据所述人名-企业关联关系,将所述企业向量中与所述企业相关联的元素标记为1,与所述企业无关联的元素标记为0。4.根据权利要求3所述的方法,其特征在于,所述对所述企业向量聚类,生成所述待查询人名的企业子集合包括:根据下述公式计算待划分的企业集合:Di=Di-1-Ci-1,(i>0)其中,D0为所述与待查询人名相关联的企业集合,C0为空集,Di为第i个待划分的企业集合,Ci为第i个企业子集;计算企业向量Dij与企业向量Dik的距离,若所述距离小于预设阈值,则将Dij所对应的企业划分至Ci中,其中,Dij为Di中的第j个企业所对应的企业向量,Dik为Di中的参考企业所对应的企业向量;根据所述Ci组成所述待查询人名的企业子集合。5.根据权利要求4所述的方法,其特征在于,所述计算企业向量Dij与企业向量Dik的距离具体为:根据下述公式计算企业向量的距离:

【专利技术属性】
技术研发人员:程浩张快
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1