简历信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31494543 阅读:23 留言:0更新日期:2021-12-18 12:33
本申请提供一种简历信息处理方法、装置、电子设备及存储介质。方法包括:基于预处理算法对获取的多份第一简历信息进行预处理,得到预处理后的多份第二简历信息;对多份第二简历信息中的每份第二简历信息中的文本数据进行数字化编码;从得到经过编码的数据集中,选取核心点,并确定核心点与其他点之间的特征距离,其他点指数据集中除去核心点之外的数据;从其他点中选取与核心点对应的聚类候选点;将聚类候选点、指定数量及预设距离范围,输入预设聚类模型进行迭代训练,得到用于对简历信息分类的目标聚类模型。如此,无需对用于训练的简历信息设置标签,有利于缩短模型训练的时长,提高模型训练的效率,降低人力成本。降低人力成本。降低人力成本。

【技术实现步骤摘要】
简历信息处理方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,具体而言,涉及一种简历信息处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,利用人工智能的网络模型,可以实现对简历信息的分类。在使用网络模型之前,需要对网络模型进行训练。例如,传统的网络模型训练方式,主要是通过对简历信息设置标签数据,然后再利用具有标签的简历信息进行模型训练,最后利用训练得到的网络模型进行简历分类。该方式的网络模型在训练之前,需要人工对大量的简历信息设置标签以进行标注,导致训练的效率低、训练所需的人力成本高。

技术实现思路

[0003]本申请实施例的目的在于提供一种简历信息处理方法、装置、电子设备及存储介质,无需人工对简历信息设置标签,能够改善模型训练的效率低、训练所需的人力成本高的问题。
[0004]为了实现上述目的,本申请的实施例通过如下方式实现:
[0005]第一方面,本申请实施例提供一种简历信息处理方法,所述方法包括:基于预处理算法对获取的多份第一简历信息进行预处理,得到预处理后的多份第二简本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种简历信息处理方法,其特征在于,所述方法包括:基于预处理算法对获取的多份第一简历信息进行预处理,得到预处理后的多份第二简历信息;基于预设编码算法,对所述多份第二简历信息中的每份第二简历信息中的文本数据进行数字化编码,得到经过编码的数据集;从所述数据集中,选取与任一份第二简历信息对应的数据作为核心点,并确定所述核心点与其他点之间的特征距离,所述其他点指所述数据集中除去所述核心点之外的数据;从所述其他点中选取与所述核心点对应的聚类候选点,其中,所述聚类候选点为所述其他点中的与所述核心点的所述特征距离最近的指定数量的点,或为所述所述其他点中的所述特征距离在与所述核心点对应的预设距离范围内的点;将所述聚类候选点、所述指定数量及所述预设距离范围,输入预设聚类模型进行迭代训练,得到用于对简历信息分类的目标聚类模型。2.根据权利要求1所述的方法,其特征在于,基于预处理算法对获取的多份第一简历信息进行预处理,得到预处理后的多份第二简历信息,包括:针对多份第一简历信息中的每份第一简历信息,合并所述每份第一简历信息中相关性大于设定值的属性所对应的文本数据,以及仅保留所述每份第一简历信息中指定属性的文本数据;将所述每份第一简历信息中所保留的表征数值类的文本数据,进行归一化,得到预处理后的所述多份第二简历信息。3.根据权利要求1所述的方法,其特征在于,所述预设编码算法为独热编码算法,对所述多份第二简历信息中的每份第二简历信息中的文本数据进行数字化编码,得到经过编码的数据集,包括:通过所述独热编码算法,将所述每份第二简历信息中与每个属性对应的文本,进行独热编码,得到与所述每份第二简历信息中的每个属性文本对应的数字,所述数据集包括所有所述数字。4.根据权利要求1所述的方法,其特征在于,从所述数据集中,选取与任一份第二简历信息对应的数据作为核心点,并确定所述核心点与其他点之间的特征距离,包括:从所述数据集中,选取与任一份第二简历信息对应的数据作为核心点,并通过预设欧式距离算法确定所述核心点与其他点之间的欧式距离,以作为所述特征距离。5.根据权利要求1所述的方法,其特征在于,将所述聚类候选点、所述指定数量及所述预设距离范围,输入预设聚类模型进行迭代训练,得到用于对简历信息分类的目标聚类模型,包括:从...

【专利技术属性】
技术研发人员:时宝旭郭玮莫海江
申请(专利权)人:湖北天天数链技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1