人员身份的识别方法、存储介质和计算机程序产品技术

技术编号:31748646 阅读:19 留言:0更新日期:2022-01-05 16:29
本公开实施例公开了一种人员身份的识别方法、存储介质和计算机程序产品。该人员身份的识别方法包括:从预先确定的人员标识集合中,确定至少两个相同的目标人员标识;分别从上述至少两个目标人员标识具有的关联关系信息中,确定上述至少两个目标人员标识分别对应的团体组织信息;将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由上述识别模型生成识别结果,其中,上述识别结果表征上述至少两个目标人员标识指示的人员是否为同一人员。本公开实施例可以采用基于轻量级梯度提升机构建的识别模型,来识别两个目标人员标识指示的人员是否为同一人员,提高了人员身份识别的准确度。高了人员身份识别的准确度。高了人员身份识别的准确度。

【技术实现步骤摘要】
人员身份的识别方法、存储介质和计算机程序产品


[0001]本公开涉及大数据
,尤其是一种人员身份的识别方法、存储介质和计算机程序产品。

技术介绍

[0002]现有技术中,计算机等电子设备往往通过标识来识别对象身份。例如,对于人员身份的识别而言,通常采用不同的人员标识,来标记不同的人员。
[0003]然而,在大数据广泛应用的背景下,数据的获取渠道呈多元化趋势。不同渠道获得的数据可能实际上所对应的对象是相同的。例如,当前市场上,可以通过获取公开官方渠道获取公司数据,并提供信息查询服务。然而由于能够获取的公开数据不能完全地覆盖所有的自然人的身份信息,公司人员身份识别(不同公司的同名人员是否是同一自然人)就成为了困扰这些公司、以及所有公司数据使用方的核心问题。
[0004]可见,如何提高身份识别的准确度,是一个值得关注的问题。

技术实现思路

[0005]本公开实施例提供一种人员身份的识别方法、存储介质和计算机程序产品,以提高身份识别的准确度。
[0006]根据本公开实施例的第一个方面,提供的一种人员身份的识别方法,包括:
[0007]从预先确定的人员标识集合中,确定至少两个相同的目标人员标识,其中,所述至少两个目标人员标识具有不同的关联关系信息;
[0008]分别从所述至少两个目标人员标识具有的关联关系信息中,确定所述至少两个目标人员标识分别对应的团体组织信息,其中,团体组织信息为人员标识指示的人员所在的团体组织的信息;
[0009]将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,其中,所述识别结果表征所述至少两个目标人员标识指示的人员是否为同一人员。
[0010]可选地,在本公开任一实施例的方法中,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:
[0011]响应于所确定的团体组织信息指示的团体组织的数量大于或等于预设的第一数量阈值,从所确定的团体组织信息中,选取预设的第二数量阈值个团体组织信息;
[0012]将所选取的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果。
[0013]可选地,在本公开任一实施例的方法中,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:
[0014]响应于所确定的团体组织信息指示的团体组织的数量大于或等于预设的第一数量阈值,确定所确定的团体组织信息指示的团体组织所在的区域,得到区域集合;
[0015]针对所述区域集合中的区域,从位于该区域的团体组织的团体组织信息中,选取至少一个团体组织信息;
[0016]将所选取的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果。
[0017]可选地,在本公开任一实施例的方法中,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:
[0018]将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型确定所述至少两个目标人员标识对应的团体组织信息之间的欧式距离,以及基于所述欧氏距离生成识别结果。
[0019]可选地,在本公开任一实施例的方法中,所述方法还包括:
[0020]将所述识别模型和所确定的团体组织信息输入至预先训练的解释模型,经由所述解释模型生成所述识别模型针对所述识别结果的解释信息。
[0021]可选地,在本公开任一实施例的方法中,所述方法还包括:
[0022]获取样本信息集合,其中,所述样本信息集合中的样本信息包括团体组织信息和预先标注的、与团体组织信息相对应的标签信息,标签信息表征团体组织信息对应的两个人员标识是否指示同一人员;
[0023]从所述样本信息集合中,确定训练样本集合;
[0024]将所述训练样本集合中的训练样本包括的团体组织信息作为输入数据,将与输入数据相对应的标签信息作为期望输出数据,训练得到识别模型。
[0025]可选地,在本公开任一实施例的方法中,所述方法还包括:
[0026]从所述样本信息集合中,确定验证样本集合;
[0027]基于所述验证样本集合,计算所述识别模型的受试者工作特征曲线下面积、准确率、精确率、召回率中的至少一项。
[0028]可选地,在本公开任一实施例的方法中,关联关系信息采用预先确定的知识图谱中的节点或者边表征,人员标识采用所述知识图谱中的节点表征;以及
[0029]所述从预先确定的人员标识集合中,确定至少两个相同的目标人员标识,包括:
[0030]从所述知识图谱中的节点表征的人员标识的集合中,确定至少两个相同的目标人员标识。
[0031]可选地,在本公开任一实施例的方法中,所述方法还包括:
[0032]基于所述识别结果,采用相同聚类标识,对所述知识图谱中表征同一人员的多个目标人员标识进行标记;
[0033]基于所述知识图谱中的目标人员标记的每个聚类标识,计算针对该聚类标识的识别结果的精准性、全面性、准确性中的至少一项。
[0034]可选地,在本公开任一实施例的方法中,团体组织信息包括公司信息;以及
[0035]所述分别从所述至少两个目标人员标识具有的关联关系信息中,确定所述至少两个目标人员标识分别对应的团体组织信息,包括:
[0036]分别从所述至少两个目标人员标识具有的关联关系信息中,确定所述至少两个目标人员标识分别对应的公司信息;以及
[0037]所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模
型,经由所述识别模型生成识别结果,包括:
[0038]将以下至少一项输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果:
[0039]所确定的至少两个公司信息之间的关系特征;
[0040]与所确定的至少两个公司信息之间存在关联关系的公司信息;
[0041]与所确定的至少两个公司信息之间存在关联关系的人员信息。
[0042]可选地,在本公开任一实施例的方法中,用于训练所述识别模型的特征数据的维数大于或等于100。
[0043]根据本公开实施例的第二个方面,提供的一种人员身份的识别装置,包括:
[0044]第一确定单元,被配置成从预先确定的人员标识集合中,确定至少两个相同的目标人员标识,其中,所述至少两个目标人员标识具有不同的关联关系信息;
[0045]第二确定单元,被配置成分别从所述至少两个目标人员标识具有的关联关系信息中,确定所述至少两个目标人员标识分别对应的团体组织信息,其中,团体组织信息为人员标识指示的人员所在的团体组织的信息;
[0046]第一输入单元,被配置成将所确定的团体组织信息输入至基于轻量级梯度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人员身份的识别方法,其特征在于,所述方法包括:从预先确定的人员标识集合中,确定至少两个相同的目标人员标识,其中,所述至少两个目标人员标识具有不同的关联关系信息;分别从所述至少两个目标人员标识具有的关联关系信息中,确定所述至少两个目标人员标识分别对应的团体组织信息,其中,团体组织信息为人员标识指示的人员所在的团体组织的信息;将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,其中,所述识别结果表征所述至少两个目标人员标识指示的人员是否为同一人员。2.根据权利要求1所述的方法,其特征在于,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:响应于所确定的团体组织信息指示的团体组织的数量大于或等于预设的第一数量阈值,从所确定的团体组织信息中,选取预设的第二数量阈值个团体组织信息;将所选取的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果。3.根据权利要求1所述的方法,其特征在于,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:响应于所确定的团体组织信息指示的团体组织的数量大于或等于预设的第一数量阈值,确定所确定的团体组织信息指示的团体组织所在的区域,得到区域集合;针对所述区域集合中的区域,从位于该区域的团体组织的团体组织信息中,选取至少一个团体组织信息;将所选取的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果。4.根据权利要求1

3之一所述的方法,其特征在于,所述将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型生成识别结果,包括:将所确定的团体组织信息输入至基于轻量级梯度提升机预先构建的识别模型,经由所述识别模型确定所述至少两个目标人员标识对应的团体组织信息之间的欧式距离,以及基于所述欧氏距离生成识别结果。5.根据权利要求1

4之一所述的方法,其特征在于,所述方法还包括:将所述识别模型和所确定的团体组织信息输入至预先训练的解释模型,经由所述解释模型生成所述识别模型针对所述识别结果的解释信息。6.根据权利要求1

5之一所述的方法,其特征在于,所述方法还包括:获取样本信息集合,其中,所述样本信息集合中的样本信息包括团体组织信息和预先标注的、与团体组织信息相对应的标签信息,标...

【专利技术属性】
技术研发人员:杨镓毓方涛
申请(专利权)人:北京房江湖科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1