一种个人信息同人判定的方法、装置和设备制造方法及图纸

技术编号:45724304 阅读:16 留言:0更新日期:2025-07-04 18:47
本发明专利技术实施例公开了一种个人信息同人判定的方法、装置和设备。本发明专利技术实施例中,通过根据获取的第一个人信息和第二个人信息分别确定其各自对应的至少一个结构化文本、至少一个半结构化文本和非结构化文本;根据第一个人信息和第二个人信息分别对应的至少一个结构化文本、至少一个半结构化文本以及所述非结构化文本,确定至少一个密集相似度和至少一个稀疏相似度、至少一个统计特征相似度以及一个全局相似度;将、至少一个密集相似度、至少一个稀疏相似度、至少一个统计特征相似度以及一个全局相似度输入到预先训练的状态感知混合专家模型,生成目标相似度。通过上述方法,可以高效准确的判断第一个人信息和第二个人信息是否为同一个人的个人信息。

【技术实现步骤摘要】

本专利技术涉及计算机,更具体地,涉及一种个人信息同人判定的方法、装置和设备


技术介绍

1、在现代招聘过程中,企业招聘专员需要在各种第三方招聘网站上获取大量的候选人的简历,将符合需求的候选人加入到企业内部的人才库中,使企业内部的人才库积累大量的候选人的简历;当企业招聘专员再次使用第三方网站挑选候选人时,无法迅速判断候选人是否已经存在于内部的人才库中,导致招聘专员需花费大量时间和精力手动比对第三方获取的简历与内部的人才库中记录的简历是否重复,不仅效率较低,也容易出现比对误差。

2、现有技术中,采用向量表征方法对简历的相似度进行判断,但是简历的文本内容通常较为冗长,经常超出向量表征方法的编码器所能处理的最大文本长度,并且,简历文本具有特定的结构化特征,使得上述向量表征方法在进行判断简历是否重复时效果较差,上述简历为个人信息的一种表现形式。

3、综上所述,如何高效准确的对个人信息是否重复进行判断,是目前需要解决的问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种个人信息同人判定的本文档来自技高网...

【技术保护点】

1.一种个人信息同人判定的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别确定其各自对应的至少一个结构化文本,具体包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别确定其各自对应的至少一个半结构化文本,具体包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别对应的所述至少一个结构化文本确定至少一个密集相似度和至少一个稀疏...

【技术特征摘要】

1.一种个人信息同人判定的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别确定其各自对应的至少一个结构化文本,具体包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别确定其各自对应的至少一个半结构化文本,具体包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述第一个人信息和所述第二个人信息分别对应的所述至少一个结构化文本确定至少一个密集相似度和至少一个稀疏相似度,具体包括:

6.根据权利要求5所述的方法,其特征在于,所述文本相似度模型为经过对比学习损失函数微调后的开源通用语义向量模型。

7.根据权利要求1所述的方法,其特征在于,根据所述第一个人信息和所述第二个人信息分别对应的所述至少一个半结构化文本确定至少一个统计特征相似度,具体包...

【专利技术属性】
技术研发人员:孙博陈祖龙
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1