人选标签预测方法、装置、设备和存储介质制造方法及图纸

技术编号:24121537 阅读:25 留言:0更新日期:2020-05-13 03:14
本发明专利技术涉及一种人选标签预测方法、装置、设备和存储介质,该方法包括:确定客观标签和软性分类标签;为待预测简历添加对应的客观标签;选取待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型;将待预测简历输入至人选标签预测模型进行预测,根据预测结果为待预测简历添加对应的软性分类标签。全面地填充了人才库中各个人选的标签,极大降低了人选标签维护的成本,并提高了效率和准确率。

Candidate label prediction methods, devices, equipment and storage media

【技术实现步骤摘要】
人选标签预测方法、装置、设备和存储介质
本专利技术涉及机器学习
,具体涉及一种人选标签预测方法、装置、设备和存储介质。
技术介绍
现有人才管理系统中,为了方便对人才的搜索,通常会用一组标签键值来存储一个人的信息和评价,这些标签包括姓名、电话、学校、公司和经历等客观标签。而实际的应用过程中,通常人选数量很大,标签维度高,标签不齐全,而靠人工维护人选的标签成本较高,也比较困难。相关技术中,利用自动简历解析技术得到简历中的字段来填充人选标签,但是这种方法通常只适用部分客观标签,其他的分类标签需要人工遵循特定的规则来维护。因此,当人选数量较大时,就会带来打标签效率低、成本高或准确率低的问题。
技术实现思路
有鉴于此,提供一种人选标签预测方法、装置、设备和存储介质,以解决现有技术中人选数量较大时,打标签效率低、成本高以及准确率低的问题。本专利技术采用如下技术方案第一方面,本申请实施例提供了一种人选标签预测方法,该方法包括:确定客观标签和软性分类标签;为待预测简历添加对应的客观标签;选取待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型;将所述待预测简历输入至所述人选标签预测模型进行预测,根据预测结果为所述待预测简历添加对应的软性分类标签。第二方面,本申请实施例提供了一种人选标签预测装置,该装置包括:标签确定模块,用于确定客观标签和软性分类标签;客观标签添加模块,用于为待预测简历添加对应的客观标签;样本确定模块,用于选取待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;训练模块,用于应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型;预测模块,用于将所述待预测简历输入至所述人选标签预测模型进行预测,根据预测结果为所述待预测简历添加对应的软性分类标签。第三方面,本申请实施例提供了一种设备,该设备包括:处理器,以及与所述处理器相连接的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于执行本申请实施例第一方面所述的人选标签预测方法;所述处理器用于调用并执行所述存储器中的所述计算机程序。第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面所述的人选标签预测方法中各个步骤。本专利技术采用以上技术方案,通过确定客观标签和软性分类标签;为待预测简历添加对应的客观标签;选取待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型;将待预测简历输入至人选标签预测模型进行预测,根据预测结果为待预测简历添加对应的软性分类标签。实现了人选标签中的软性分类标签的自动预测,并与经过简历解析直接添加的客观标签进行融合,全面填充了人才库中各个人选的标签,极大降低了人选标签维护的成本,并提高了效率和准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种人选标签预测方法的流程图;图2是本专利技术实施例提供的另一种人选标签预测方法的流程图;图3是本专利技术实施例提供的一种人选标签预测装置的结构示意图;图4是本专利技术实施例提供的一种设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。实施例图1为本专利技术实施例提供的一种人选标签预测方法的流程图,该方法可以由本专利技术实施例提供的人选标签预测装置来执行,该装置可采用软件和/或硬件的方式实现。参考图1,该方法具体可以包括如下步骤:S101、确定客观标签和软性分类标签。其中,人才管理系统中为了方便对人才的搜索,通常会用一组标签键值对的方式来存储一个人的信息和评价。首先,要确定可以应用的对简历进行标注的若干客观标签和软性分类标签,客观标签通常可以包括姓名、电话、性别、邮箱、出生年月、公司、目前职位、任职经历、工作地点、学历、学校名称等,而软性分类标签通常可以包括行业、职能、业绩、平台、职级、擅长方向等。S102、为待预测简历添加对应的客观标签。具体的,待预测简历通常为大量的,例如以10000份为例,由于可以直接在人选简历中找到对应的字段就可以为每个待预测简历添加对应的客观标签,因此,这里为每个待预测简历添加对应的客观标签来实现客观标签的完善。也即,执行完该步骤,每个待预测简历均添加了对应的客观标签,接下来需要再为每个待预测简历添加对应的软性分类标签。S103、选取待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本。为了提高训练速度和训练精度,在大量的待预测简历中选取预设比例的简历来按照软性分类标签进行标注,可选的,预设比例通常可以取10%。然后将标注后的待预测简历分为两部分,一部分称为训练样本,用来训练人选标签预测模型,另一部分作为测试样本,用来才测试人选标签预测模型的预测准确率,以便及时调整人选标签预测模型中的参数来提高预测准确率。在一个具体的例子中,待预测简历是10000份,则进行标注的待预测简历可以是1000份。在一个具体的例子中,按照软性分类标签进行标注时,通常类别是指有限的几个类别。S104、应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型。具体的,应用设定的机器学习预测算法对训练样本进行训练,当满足训练终止条件时停止训练,确定人选标签预测模型。在一个具体的例子中,训练终止条件可以是预测准确率达到设定准确率阈值,还可以是训练次数满足一定的次数条件,这里不进行限定。在一个具体的例子中,训练过程可以理解为应用设定的机器学习预测算法来学习简历中的数据内容的特征和标签之间的关系,从而对未标注的简历进行预测。例如,本申请实施例中应用的是朴素贝叶斯分类器,还可以用TextCNN(TextConvolutionalNeuralNetworks,文本分类卷积神经网络)分类器或Bert分类器进行替代,这里不进行限定。S105、将待预测简历输入至人选标签预测模型进行预测,根据预测结果为待预测简历添加对应本文档来自技高网...

【技术保护点】
1.一种人选标签预测方法,其特征在于,包括:/n确定客观标签和软性分类标签;/n为待预测简历添加对应的客观标签;/n选取所述待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;/n应用设定的机器学习预测算法,对所述训练样本进行训练,确定人选标签预测模型;/n将所述待预测简历输入至所述人选标签预测模型进行预测,根据预测结果为所述待预测简历添加对应的软性分类标签。/n

【技术特征摘要】
1.一种人选标签预测方法,其特征在于,包括:
确定客观标签和软性分类标签;
为待预测简历添加对应的客观标签;
选取所述待预测简历中预设比例的简历,按照软性分类标签进行标注,其中,标注后的待预测简历分为训练样本和测试样本;
应用设定的机器学习预测算法,对所述训练样本进行训练,确定人选标签预测模型;
将所述待预测简历输入至所述人选标签预测模型进行预测,根据预测结果为所述待预测简历添加对应的软性分类标签。


2.根据权利要求1所述的方法,其特征在于,所述为待预测简历添加对应的客观标签,包括:
对待预测简历进行解析;
将解析结果与所述客观标签的字段进行匹配,以确定所述待预测简历对应的客观标签;
为所述待预测简历添加对应的客观标签。


3.根据权利要求2所述的方法,其特征在于,所述对待预测简历进行解析之后,还包括:
将解析后的待预测简历的简历内容进行分词,得到所述待预测简历中的关键词。


4.根据权利要求3所述的方法,其特征在于,所述应用设定的机器学习预测算法,对训练样本进行训练,确定人选标签预测模型,包括:
针对软性分类标签下的每个类别,计算属于所述类别的待预测简历中的关键词对应的特异程度值;
按照所述特异程度值选取预设数量的关键词作为目标关键词;
将所述软性分类标签下的各个类别中的目标关键词组合为关键词词表;
基于分词后的简历内容,筛选出属于所述关键词词表的关键词作为特征关键词;
应用设定的机器学习算法,将所述特征关键词作为输入,将标注的标签作为学习目标来训练所述训练样本,以确定人选标签预测模型。


5.根据权利要求4所述的方法,其特征在于,所述应用设定的机器学习算法,将所述特征关键词作为输入,将标注的标签作为学习目标来训练所述训练样本,以确定人选标签预测模型,包...

【专利技术属性】
技术研发人员:叶佐昌蒋苗唐长成兰兵王禹卓罗曼雪
申请(专利权)人:浙江阿尔法人力资源有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1