近义词推送方法、装置、电子设备及介质制造方法及图纸

技术编号:25043399 阅读:15 留言:0更新日期:2020-07-29 05:33
本发明专利技术公开一种近义词推送方法,包括:获取面试题目;配置第一预设个数与面试题目对应的答案的关键词;基于超大词向量模型预先训练得到目标词向量模型;根据目标词向量模型构建词向量矩阵得到词‑索引文件;基于所有词向量构建二叉树;遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并构建优先队列;对优先队列中的所述第一候选词向量进行去重;获取去重后的优先队列中排序在前第二预设个数的目标词向量;基于目标词向量和词‑索引文件推送第二预设个数近义词供用户选择。本发明专利技术还提供一种近义词推送装置、电子设备及存储介质。通过本发明专利技术可以为用户快速推送近义词。

【技术实现步骤摘要】
近义词推送方法、装置、电子设备及介质
本专利技术涉及计算机
,具体涉及一种近义词推送方法、装置、电子设备及存储介质。
技术介绍
项目需求为人工智能(AI)面试规则配置系统中,部分公司的用户可实时更新专家规则中的回答关键词。但用户在填写回答关键词时,需要手动、纯人力的输入大量信息,系统无法对用户输入关键词时提供帮助,如近义词的推荐等。这种操作降低了用户的编写效率,也极度依赖用户对回答关键词的个人理解,无法保证用户输入的关键词是否较为全量且客观。
技术实现思路
鉴于以上内容,有必要提出一种近义词推送方法、装置、电子设备及存储介质,可以为用户在进行AI面试时提供快速地近义词推送。本专利技术的第一方面提供一种近义词推送方法,所述方法包括:获取面试题目;配置第一预设个数与所述面试题目对应的答案的关键词;基于超大词向量模型预先训练得到目标词向量模型;根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;基于所述目标词向量模型中的所有词向量构建二叉树;遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;对所述优先队列中的所述第一候选词向量进行去重;获取去重后的优先队列中排序在前第二预设个数的目标词向量;基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。优选地,所述配置第一预设个数与所述面试题目对应的答案的关键词的步骤包括:根据预先构建的题目解析模型分析所述面试题目得到对应的题目意图;根据所述题目意图和预先建立的知识库,确定所述面试题目对应的答案;及根据所述对应的答案提取第一预设个数关键词。优选地,所述基于超大词向量模型预先训练得到目标词向量模型的步骤包括:扩充所述超大词向量模型中的机器人面试场景语料,其中,包括对所述机器人面试场景语料进行分词、去停用词及基于CBOW模式增量训练词向量操作;根据扩充语料后的超大词向量模型训练得到目标词向量模型。优选地,根据所述目标词向量模型构建词向量矩阵得到词-索引文件的步骤包括:以每个词的维度为行数,以所述目标词向量模型中所有词的总数为列数构建词向量矩阵;所述词向量矩阵中的每一行对应一个索引;根据所述词向量矩阵构建词-索引文件,并输出所述词-索引文件。优选地,所述基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择包括:获取所述第二预设个数的目标词向量对应的目标索引;根据所述词-索引文件查询与所述目标索引对应的词向量;推送所述词向量对应的近义词供用户选择。优选地,所述从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列包括:以所述关键词作为所述二叉树的根节点;遍历所述根节点下的所有中间节点;计算所述根节点与每一个中间节点之间的距离;确定大于预设距离阈值的目标距离对应的中间节点为第一层目标节点;遍历所述第一层目标节点下的所有中间节点直至最后一层叶子节点;将所有叶子节点中的词向量作为第一候选词向量;计算所述第一候选词向量与所述关键词之间的相似度;根据相似度的大小顺序将所述第一候选词向量插入优先队列中。优选地,根据预设规则筛选查找到的第二预设个数近义词,其中,所述预设规则包括一下规则中的至少一种:根据词语字数调整查询到的第二预设个数近义词的顺序;按词汇的类型来筛选查询到的第二预设个数近义词;去除所述第二预设个数近义词中字数多于所述关键字的字数预设个数的词汇。本专利技术的第二方面提供一种近义词推送装置,所述装置包括:获取模块,用于获取面试题目;配置模块,用于配置第一预设个数与所述面试题目对应的答案的关键词;训练模块,用于基于超大词向量模型预先训练得到目标词向量模型;构建模块,用于根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;所述构建模块,还用于基于所述目标词向量模型中的所有词向量构建二叉树;遍历模块,用于遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;去重模块,用于对所述优先队列中的所述第一候选词向量进行去重;所述获取模块,还用于获取去重后的优先队列中排序在前第二预设个数的目标词向量;及推送模块,用于基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述近义词推送方法。本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述近义词推送方法。本专利技术所述的近义词推送方法、装置、电子设备及存储介质。通过配置第一预设个数与所述面试题目对应的答案的关键词,在预先训练的词向量模型中查找与每个关键词对应的第二预设个数近义词,推送所述第二预设个数近义词供用户选择。可以为机器人面试过程中配置更多面试题目对应的答案的关键字的近义词。方便人力资源HR在对求职者进行面试时,为面试题目配置更加全面的答案。从而在接收到求职者针对面试题目的答案时,可以更准确地分析求职者的答案,方便人力资源给出对求职者的更全面的分析。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1是本专利技术实施例一提供的近义词推送方法的流程图。图2是本专利技术实施例二提供的推送装置的功能模块图。图3是本专利技术实施例三提供的电子设备的示意图。如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施例对本专利技术进行详细描述。需要说明的是,在不冲突的情况下,本专利技术的实施例及实施例中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书本文档来自技高网
...

【技术保护点】
1.一种近义词推送方法,其特征在于,所述方法包括:/n获取面试题目;/n配置第一预设个数与所述面试题目对应的答案的关键词;/n基于超大词向量模型预先训练得到目标词向量模型;/n根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;/n基于所述目标词向量模型中的所有词向量构建二叉树;/n遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;/n对所述优先队列中的所述第一候选词向量进行去重;/n获取去重后的优先队列中排序在前第二预设个数的目标词向量;/n基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。/n

【技术特征摘要】
1.一种近义词推送方法,其特征在于,所述方法包括:
获取面试题目;
配置第一预设个数与所述面试题目对应的答案的关键词;
基于超大词向量模型预先训练得到目标词向量模型;
根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;
基于所述目标词向量模型中的所有词向量构建二叉树;
遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;
对所述优先队列中的所述第一候选词向量进行去重;
获取去重后的优先队列中排序在前第二预设个数的目标词向量;
基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。


2.如权利要求1所述的近义词推送方法,其特征在于,所述配置第一预设个数与所述面试题目对应的答案的关键词的步骤包括:
根据预先构建的题目解析模型分析所述面试题目得到对应的题目意图;
根据所述题目意图和预先建立的知识库,确定所述面试题目对应的答案;及
根据所述对应的答案提取第一预设个数关键词。


3.如权利要求1所述的近义词推送方法,其特征在于,所述基于超大词向量模型预先训练得到目标词向量模型的步骤包括:
扩充所述超大词向量模型中的机器人面试场景语料,其中,包括对所述机器人面试场景语料进行分词、去停用词及基于CBOW模式增量训练词向量操作;
根据扩充语料后的超大词向量模型训练得到目标词向量模型。


4.如权利要求3所述的近义词推送方法,其特征在于,根据所述目标词向量模型构建词向量矩阵得到词-索引文件的步骤包括:
以每个词的维度为行数,以所述目标词向量模型中所有词的总数为列数构建词向量矩阵;
所述词向量矩阵中的每一行对应一个索引;
根据所述词向量矩阵构建词-索引文件,并输出所述词-索引文件。


5.如权利要求3所述的近义词推送方法,其特征在于,所述基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择包括:
获取所述第二预设个数的目标词向量对应的目标索引;
根据所述词-索引文件查询与所述目标索引对应的词向量;
推送所述词向量对应的近义词供用户选择。


6.如权利要求1所述的近义词推送方法,其特征在于,所述从所述二叉树中查...

【专利技术属性】
技术研发人员:陈林金戈徐亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1