【技术实现步骤摘要】
近义词推送方法、装置、电子设备及介质
本专利技术涉及计算机
,具体涉及一种近义词推送方法、装置、电子设备及存储介质。
技术介绍
项目需求为人工智能(AI)面试规则配置系统中,部分公司的用户可实时更新专家规则中的回答关键词。但用户在填写回答关键词时,需要手动、纯人力的输入大量信息,系统无法对用户输入关键词时提供帮助,如近义词的推荐等。这种操作降低了用户的编写效率,也极度依赖用户对回答关键词的个人理解,无法保证用户输入的关键词是否较为全量且客观。
技术实现思路
鉴于以上内容,有必要提出一种近义词推送方法、装置、电子设备及存储介质,可以为用户在进行AI面试时提供快速地近义词推送。本专利技术的第一方面提供一种近义词推送方法,所述方法包括:获取面试题目;配置第一预设个数与所述面试题目对应的答案的关键词;基于超大词向量模型预先训练得到目标词向量模型;根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;基于所述目标词向量模型中的所有词向量构建二叉树;遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;对所述优先队列中的所述第一候选词向量进行去重;获取去重后的优先队列中排序在前第二预设个数的目标词向量;基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。优选地,所述配 ...
【技术保护点】
1.一种近义词推送方法,其特征在于,所述方法包括:/n获取面试题目;/n配置第一预设个数与所述面试题目对应的答案的关键词;/n基于超大词向量模型预先训练得到目标词向量模型;/n根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;/n基于所述目标词向量模型中的所有词向量构建二叉树;/n遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;/n对所述优先队列中的所述第一候选词向量进行去重;/n获取去重后的优先队列中排序在前第二预设个数的目标词向量;/n基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。/n
【技术特征摘要】
1.一种近义词推送方法,其特征在于,所述方法包括:
获取面试题目;
配置第一预设个数与所述面试题目对应的答案的关键词;
基于超大词向量模型预先训练得到目标词向量模型;
根据所述目标词向量模型构建词向量矩阵得到词-索引文件,其中,所述词-索引文件包括词向量与索引之间的对应关系;
基于所述目标词向量模型中的所有词向量构建二叉树;
遍历所述二叉树,从所述二叉树中查询出与所述关键词的距离大于预设距离阈值的第一候选词向量并基于所述第一候选词向量构建优先队列;
对所述优先队列中的所述第一候选词向量进行去重;
获取去重后的优先队列中排序在前第二预设个数的目标词向量;
基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择。
2.如权利要求1所述的近义词推送方法,其特征在于,所述配置第一预设个数与所述面试题目对应的答案的关键词的步骤包括:
根据预先构建的题目解析模型分析所述面试题目得到对应的题目意图;
根据所述题目意图和预先建立的知识库,确定所述面试题目对应的答案;及
根据所述对应的答案提取第一预设个数关键词。
3.如权利要求1所述的近义词推送方法,其特征在于,所述基于超大词向量模型预先训练得到目标词向量模型的步骤包括:
扩充所述超大词向量模型中的机器人面试场景语料,其中,包括对所述机器人面试场景语料进行分词、去停用词及基于CBOW模式增量训练词向量操作;
根据扩充语料后的超大词向量模型训练得到目标词向量模型。
4.如权利要求3所述的近义词推送方法,其特征在于,根据所述目标词向量模型构建词向量矩阵得到词-索引文件的步骤包括:
以每个词的维度为行数,以所述目标词向量模型中所有词的总数为列数构建词向量矩阵;
所述词向量矩阵中的每一行对应一个索引;
根据所述词向量矩阵构建词-索引文件,并输出所述词-索引文件。
5.如权利要求3所述的近义词推送方法,其特征在于,所述基于所述第二预设个数的目标词向量和词-索引文件推送第二预设个数近义词供用户选择包括:
获取所述第二预设个数的目标词向量对应的目标索引;
根据所述词-索引文件查询与所述目标索引对应的词向量;
推送所述词向量对应的近义词供用户选择。
6.如权利要求1所述的近义词推送方法,其特征在于,所述从所述二叉树中查...
【专利技术属性】
技术研发人员:陈林,金戈,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。