智能面试中专业术语的提取方法、装置、设备及介质制造方法及图纸

技术编号:25709532 阅读:23 留言:0更新日期:2020-09-23 02:56
本发明专利技术公开了一种智能面试中专业术语的提取方法、装置、计算机设备及存储介质,该方法包括:按照预设N个维度,对应答语句中的每个字符进行分割,得到每个字符对应的N个词组集合,实现将该字符对应的所有词组,均作为候选词组,同时,对历史面试词库中每个词组的词频,确定词组集合的权重信息,实现对候选词组赋予更符合面试场景的权重,通过权重信息确定每个字符的表征信息,再结合字符的表征信息,采用预设的结构简单的序列标记模型,确定应答语句中包含的命名实体,并将命名实体作为专业术语存储至区块链网络中,而无需使用复杂的命名实体提取模型,提高确定命名实体的效率。

【技术实现步骤摘要】
智能面试中专业术语的提取方法、装置、设备及介质
本专利技术涉及人工智能领域,尤其涉及一种智能面试中专业术语的提取方法、装置、设备及介质。
技术介绍
招聘面试是一项费时费力的工作,因为候选人数众多而面试官却有限,面试官需要在一天内连续面试大量候选人。为了及时对候选人的经历提出相关的问题,了解候选人的专业技能掌握情况,提取候选人的经历描述和简历中提到的专业术语并进行进一步的提问就很重要。但是,专业术语的提取需要依赖命名实体识别,命名实体识别是通过自然语言处理算法进行三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体的提取,现有的算法在分词时会直接给字符选择最有可能的分段标签,而不是考虑所有的可能性,而面试过程中涉及较多的专业术语,这些专业术语中大部分难以被预设好的命名实体收录,使得识别准确率收到训练语料的影响较大,或多或少存在识别准确率不够高的问题,同时,由于使用语料较多,需要复杂结构的模型进行处理,使得运算效率较低。
技术实现思路
本专利技术实施例提供一种智能面试中专业术语本文档来自技高网...

【技术保护点】
1.一种智能面试中专业术语的提取方法,其特征在于,所述智能面试中专业术语的提取方法包括:/n使用历史面试词库,扫描智能面试中的应答语句,并分别按照预设N个维度,对所述应答语句中的每个字符进行分割,得到每个字符对应的N个词组集合,其中,N为正整数;/n对所述历史面试词库中每个词组的出现次数进行统计,得到每个词组的词频,并根据每个所述词组的词频,确定每个字符对应的所述词组集合的权重信息;/n对所述权重信息进行平滑处理,得到每个字符在N个所述词组集合中的向量表示;/n对每个所述字符的向量表示进行信息提取,得到每个所述字符的表征信息;/n结合所述字符的表征信息,采用预设的序列标记模型,确定所述应答语句...

【技术特征摘要】
1.一种智能面试中专业术语的提取方法,其特征在于,所述智能面试中专业术语的提取方法包括:
使用历史面试词库,扫描智能面试中的应答语句,并分别按照预设N个维度,对所述应答语句中的每个字符进行分割,得到每个字符对应的N个词组集合,其中,N为正整数;
对所述历史面试词库中每个词组的出现次数进行统计,得到每个词组的词频,并根据每个所述词组的词频,确定每个字符对应的所述词组集合的权重信息;
对所述权重信息进行平滑处理,得到每个字符在N个所述词组集合中的向量表示;
对每个所述字符的向量表示进行信息提取,得到每个所述字符的表征信息;
结合所述字符的表征信息,采用预设的序列标记模型,确定所述应答语句中包含的命名实体,并将所述命名实体作为所述专业术语。


2.如权利要求1所述的智能面试中专业术语的提取方法,其特征在于,N的取值为4,所述预设4个维度中,第一维度为以字符作为命名实体开头的词组,第二维度为以字符作为命名实体中间的词组,第三维度为以字符作为命名实体结尾的词组,第四维度为以字符本身作为命名实体的词组。


3.如权利要求2所述的智能面试中专业术语的提取方法,其特征在于,所述根据每个所述词组的词频,确定每个字符对应的所述词组集合的权重信息包括:
针对每个字符,采用如下公式确定所述字符对应的词组集合的权重信息:






其中,vs为所述词组集合的权重信息,L是字符ω对应的四个词组集合的长度,ωc表示组成字符ω的词组,z(ω)表示ωc在所述述历史面试词库中出现的词频,eω(ω)代表ωc的嵌入向量,B、M、E、S分别为四个维度的词组集合。


4.如权利要求3所述的智能面试中专业术语的提取方法,其特征在于,所述对所述权重信息进行平滑处理,得到每个字符在N个所述词组集合中的向量表示包括:
针对每个字符,对所述字符对应的N个所述词组集合中的每个词组,按照词频由低到高的顺序进行排序,得到排序结果;
获取预设比例值,根据所述预设比例值,确定选取数量M,并取所述排序结果的前M个词频对应的词组,作为待处理词组;
按照预设的加权方式,提升所述待处理词组的权重,并对所述字符对应的词组集合的权重信息进行更新;
对更新后的词组集合的权重信息进行向量化,得到所述字符在N个所述词组集合中的向量表示。


5.如权利要求1至4任一项所述的智能面试中专业术语的提取方法,其特征在于,所述对每个所述字符的向量表示进行...

【专利技术属性】
技术研发人员:邓悦金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1