一种职位标签推荐方法和计算设备技术

技术编号:17265303 阅读:33 留言:0更新日期:2018-02-14 12:46
本发明专利技术公开了一种职位标签推荐方法,适于在计算设备中执行,该计算设备中存储有职位标签模板和职位标签模型,该模板和模型均可以用于生成职位标签,该方法包括:从招聘者发布的职位描述信息中提取职位标题内容和职位详情内容;根据职位标签模板对职位标题内容进行模板匹配,得到标题类标签;根据职位标签模板对职位详情内容进行模板匹配,得到该职位详情内容所对应的第一详情类标签;将职位详情内容转换为文本向量,利用职位标签模型对该文本向量进行处理,得到第二详情类标签以及各标签的输出概率;以及按照标题类标签、第一详情类标签和第二详情类标签的优先顺序,选取目标数目的标签作为行业标签进行推荐。本发明专利技术还公开了相应的计算设备。

A method of recommendation and computing equipment for job label

The invention discloses a position tag recommendation method is suitable for execution in a computing device, storing the calculation device position label template and label position model, the template and the model can be used to generate position labels, the method includes: extracting job content and job title details description of the position information from the release of the interviewer according to the position; template of job title content matching, to obtain the title label; according to the position label template of job details, details, first class labels get the job details corresponding to the position; details into a text vector, using position label model processing of the text vector, get the output probability of second class labels and details of each label; and in accordance with the title label, first class label details And second details of the priority of the class label, select the target number of labels as industry labels recommended. The present invention also discloses the corresponding computing equipment.

【技术实现步骤摘要】
一种职位标签推荐方法和计算设备
本专利技术涉及互联网
,尤其涉及一种职位标签推荐方法和计算设备。
技术介绍
随着互联网技术的发展,网络应聘/招聘已经成了求职者应聘工作、用人单位招聘员工的主要途径。用人单位和求职者在第三方的人才招聘网站上注册账号,相互之间进行搜索和交流,以寻求最满意的对象。职位标签是一种职位分类更准确、更具体的,用来标记招聘者所发布的职位的关键词,以便于应聘者了解职位性质及搜索职位。如果所设置的标签中包含了应聘者搜索职位时所使用的关键词,就能方便应聘者快速搜索到招聘者所发布的职位。而且,具体的个性化的标签可以让发布的职位得到充分展现,也方便应聘者更准确地找到招聘者发布的职位。另外,同一职位可能会有不同的称呼,如果设置标签时能考虑到这方面,将有助于不同应聘者快速找到自己需要的信息。通常可以根据职位名称、职位要求、职位类别、岗位期望等与职位相关联的信息来设置职位标签。职位标签的内容可以由招聘者自主定义,但这种方法比较耗时耗力,也需要招聘者对本行业有较深了解。因此,需要一种能够为招聘者自主推荐职位标签的方法。
技术实现思路
为此,本专利技术提供一种职位标签推荐方法和计算设备,以力图解决或至少缓解上面存在的问题。根据本专利技术的一个方面,提供了一种职位标签推荐方法,适于在计算设备中执行,该计算设备中分别存储有职位标签模板和职位标签模型,该模板和模型均可以用于生成职位标签,该方法包括步骤:从招聘者发布的职位描述信息中提取职位标题内容和职位详情内容;根据职位标签模板对职位标题内容进行模板匹配,得到标题类标签;根据职位标签模板对职位详情内容进行模板匹配,得到该职位详情内容所对应的第一详情类标签;将职位详情内容转换为文本向量,利用职位标签模型对该文本向量进行处理,得到该职位详情内容所对应的第二详情类标签以及各标签的输出概率;以及按照标题类标签、第一详情类标签和第二详情类标签的优先级顺序,选取目标数目的标签作为职位标签进行推荐。可选地,在根据本专利技术的方法中,计算设备中还存储有行业标签表,行业标签表中存储有不同的公司简称及其行业标签的键值对,该方法还包括步骤:从招聘者发布的职位描述信息中提取公司简称内容,并从行业标签表中获取该公司简称所对应的标签,作为公司类标签;以及当标题类标签、第一详情类标签和第二详情类标签的数目未达到目标数目时,选取相应需求数目的公司类标签作为职位标签进行推荐。可选地,在根据本专利技术的方法中,还包括生成行业标签表的步骤:获取不同公司的公司名称及其对应的行业标签,并过滤掉该名称中的无用词缀,从而得到各公司简称及其行业标签的键值对。可选地,在根据本专利技术的方法中,根据职位标签模板对职位标题内容进行模板匹配的步骤包括:过滤职位标题内容中的干扰词汇,并根据职位标签模板对剩下的内容进行模板匹配。可选地,在根据本专利技术的方法中,根据职位标签模板对职位详情内容进行模板匹配的步骤包括:去除职位详情中的html5标签,并根据文本换行符对其进行分句处理;从分句后的内容中定位出目标关键词所在的语句;以及根据职位标签模板对定位出的语句进行模板匹配。可选地,在根据本专利技术的方法中,目标关键词包括经验、专业、行业和教育背景中的至少一种。可选地,在根据本专利技术的方法中,将职位详情内容转换为文本向量的步骤包括:去除职位详情内容中的html5标签后,再对其进行分词和断行处理,并将分词和断行处理后的内容转换为文本向量。可选地,在根据本专利技术的方法中,还包括训练职位标签模型的步骤:获取不同的职位标题,并生成各职位标题所对应的准确职位标签;以及将各职位标题转换为文本向量,并将各文本向量及其对应的职位标签作为训练样本,采用逻辑回归模型对该训练样本进行训练,得到职位标签模型。可选地,在根据本专利技术的方法中,生成各职位标题所对应的准确职位标签的步骤包括:根据职位标签模板生成各职位标题所对应的准职位标签,并接收管理者对该准职位标签进行的人工调整,得到准确职位标签。可选地,在根据本专利技术的方法中,将职位标题内容转换为文本向量的方法为TF-IDF归一化方法;逻辑回归模型为MultiClasses-LogisticRegression模型。可选地,在根据本专利技术的方法中,选取目标数目的标签进行推荐的步骤包括:根据标题类标签和第一详情类标签的总数目确定第二详情类标签的概率阈值,并选取输出概率大于该概率阈值的第二详情类标签;以及将标题类标签、第一详情类标签,以及选取到的第二详情类标签按照先后顺序进行推荐,其中,选取到的第二详情类标签按照输出概率由大至小的顺序推荐。可选地,在根据本专利技术的方法中,当标题类标签和第一详情类标签的总数目分别为0、1和2时,对应的第二详情类标签的概率阈值分别为0.35、0.5和0.8。根据本专利技术的另一方面,提供了一种计算设备,包括:一个或多个处理器;存储器;和一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如上所述方法中的任一方法的指令。根据本专利技术的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行如上所述的方法中的任一方法。根据本专利技术提供的技术方案,计算设备中分别维护一个职位标签模板、职位标签模型和行业标签表,分别从招聘者所发布的职位描述信息中提取到职位标题内容、职位详情内容和公司简称内容。然后,根据职位标签模板对职位标题和职位详情进行匹配,得到标题类标签和第一详情类标签;根据职位标签模型对职位详情进行处理,得到第二详情类标签及各标签的输出概率;根据行业标签表查询公司简称所对应的行业标签,作为公司类标签。最后,根据标题类标签、第一详情类标签、第二详情类标签和公司类标签这个从优到次的顺序选取目标数目的标签作为职位标签进行推荐。其中,还可以根据前两种标签的总数选取符合一定概率阈值的第三类标签进行推荐。也就是本专利技术通过多种策略分别得到发布职位信息的标签,并按照优先顺序进行融合后作为要推荐的职位标签,其能提供准确的职位标签,推荐准确率可达到96.8%,从而可以有效提高求职者的职位搜索准确度,应聘/招聘双方的满意度。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本专利技术一个实施例的计算设备100的示意图;以及图2示出了根据本专利技术一个实施例的职位标签推荐方法200的流程图;以及图3示出了根据本专利技术另一个实施例的职位标签推荐方法的示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个本文档来自技高网...
一种职位标签推荐方法和计算设备

【技术保护点】
一种职位标签推荐方法,适于在计算设备中执行,所述计算设备中分别存储有职位标签模板和职位标签模型,该模板和模型均可以用于生成职位标签,所述方法包括步骤:从招聘者发布的职位描述信息中提取职位标题内容和职位详情内容;根据所述职位标签模板对职位标题内容进行模板匹配,得到标题类标签;根据所述职位标签模板对职位详情内容进行模板匹配,得到该职位详情内容所对应的第一详情类标签;将职位详情内容转换为文本向量,利用所述职位标签模型对该文本向量进行处理,得到该职位详情内容所对应的第二详情类标签以及各标签的输出概率;以及按照标题类标签、第一详情类标签和第二详情类标签的优先级顺序,选取目标数目的标签作为职位标签进行推荐。

【技术特征摘要】
1.一种职位标签推荐方法,适于在计算设备中执行,所述计算设备中分别存储有职位标签模板和职位标签模型,该模板和模型均可以用于生成职位标签,所述方法包括步骤:从招聘者发布的职位描述信息中提取职位标题内容和职位详情内容;根据所述职位标签模板对职位标题内容进行模板匹配,得到标题类标签;根据所述职位标签模板对职位详情内容进行模板匹配,得到该职位详情内容所对应的第一详情类标签;将职位详情内容转换为文本向量,利用所述职位标签模型对该文本向量进行处理,得到该职位详情内容所对应的第二详情类标签以及各标签的输出概率;以及按照标题类标签、第一详情类标签和第二详情类标签的优先级顺序,选取目标数目的标签作为职位标签进行推荐。2.如权利要求1所述的方法,其中,所述计算设备中还存储有行业标签表,所述行业标签表中存储有不同的公司简称及其行业标签的键值对,该方法还包括步骤:从招聘者发布的职位描述信息中提取公司简称内容,并从所述行业标签表中获取该公司简称所对应的标签,作为公司类标签;以及当所述标题类标签、第一详情类标签和第二详情类标签的数目未达到目标数目时,选取相应需求数目的公司类标签作为职位标签进行推荐。3.如权利要求2所述的方法,其中,还包括生成所述行业标签表的步骤:获取不同公司的公司名称及其对应的行业标签,并过滤掉该名称中的无用词缀,从而得到各公司简称及其行业标签的键值对。4.如权利要求1所述的方法,其中,所述根据所述职位标签模板对职位标题内容进行模板匹配的步骤包括...

【专利技术属性】
技术研发人员:张放
申请(专利权)人:北京拉勾科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1