问题选择方法、知识图谱构建方法、装置及电子设备制造方法及图纸

技术编号:31494007 阅读:18 留言:0更新日期:2021-12-18 12:31
本申请提供一种问题选择方法、知识图谱构建方法、装置及电子设备,属于计算机技术领域。该问题选择方法包括获取预先建立的问题知识图谱,所述问题知识图谱包括问题集和所述问题集中任意两个问题的语义相似度;从所述问题知识图谱中确定第一问题;从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题;输出所述第一问题和所述目标问题。由于目标问题与第一问题的语义相似度相关,因此,目标问题和第一问题均是同一知识面的问题,通过目标问题和第一问题对面试者进行提问,能较为全面地考核面试者对该知识面的掌握程度,从而实现帮助面试官提问,降低面试对面试官个人专业能力的要求。专业能力的要求。专业能力的要求。

【技术实现步骤摘要】
问题选择方法、知识图谱构建方法、装置及电子设备


[0001]本申请涉及计算机的
,具体而言,涉及一种问题选择方法、知识图谱构建方法、装置及电子设备。

技术介绍

[0002]在面试中,面试官会向面试者提问,以判断面试者是否符合面试要求,但目前的面试方法依靠面试官的个人能力来对面试者进行提问,这种面试方法往往需要至少一位人力资源管理方面的专业人员和至少一位面试岗位所属领域的专业人员作为面试官,同时对面试者进行面试,在面试官向面试者针对面试岗位所属
提出一个问题后,往往还需要针对该领域再次向面试者提出其他问题,以全面考核面试者的专业能力,但该方法要求面试官全面掌握该领域的专业知识,对面试官的个人专业能力要求较高,使得在面试时,需要具有专业能力较高的人员作为面试官,提高了面试的人力成本,并且现有的面试方式效率较低。

技术实现思路

[0003]本申请提供一种问题选择方法、知识图谱构建方法、装置及电子设备,以改善现有面试方式存在面试效率低以及面试所需人力成本高的问题。
[0004]第一方面,本申请提供一种问题选择方法,包括:获取预先建立的问题知识图谱,所述问题知识图谱包括问题集和所述问题集中任意两个问题的语义相似度,其中,所述问题集中的问题表征所述问题知识图谱中的问题节点,任意两个问题的语义相似度表征对应的两个问题节点的连接关系;从所述问题知识图谱中确定第一问题;从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题;输出所述第一问题和所述目标问题。
[0005]本申请实施例中,通过事先建立问题知识图谱,使得在面试时,可以在确定第一问题后,从问题知识图谱中确定与第一问题的语义相似度相关的目标问题。由于目标问题与第一问题的语义相似度相关,因此,目标问题和第一问题均是同一知识面的问题,通过目标问题和第一问题对面试者进行提问,能较为全面地考核面试者对该知识面的掌握程度,从而实现帮助面试官提问,降低面试对面试官个人专业能力的要求,进而改善了现有面试方式存在面试效率低以及面试所需人力成本高的问题。
[0006]结合上述第一方面提供的技术方案,在一些可能的实施方式中,从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题,包括:从所述问题知识图谱中确定与所述第一问题的语义相似度大于预设阈值的目标问题。
[0007]本申请实施例中,将知识图谱中与第一问题的语义相似度大于预设阈值的问题作为目标问题,通过预设阈值来对知识图谱中的问题进行筛选,可以使最终得到的目标问题与第一问题的相关性更高,从而尽可能保证目标问题与第一问题考核的知识点属于同一知识面。
[0008]结合上述第一方面提供的技术方案,在一些可能的实施方式中,从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题,包括:从所述问题知识图谱中确定与所述第一问题的语义相似度大于第一预设阈值的第二问题,并从所述问题知识图谱中将所述第一问题删除,得到第二问题知识图谱;从所述第二问题知识图谱中确定与所述第二问题的语义相似度大于第二预设阈值的第三问题,并从所述第二问题知识图谱中将所述第二问题删除,得到第三问题知识图谱,直至满足预设停止条件;所述目标问题包括第二问题、第三问题。
[0009]本申请实施例中,通过第一预设阈值来对问题知识图谱中的问题进行筛选,得到与第一问题的语义相似度大于第一预设阈值的第二问题,并从问题知识图谱中删除第一问题,得到第二问题知识图谱;再通过第二预设阈值来对第二问题知识图谱中的问题进行筛选,得到与第二问题的语义相似度大于第一预设阈值的第三问题,并从问题知识图谱中删除第二问题,得到第二问题知识图谱,以此类推,直至满足预设停止条件,得到包括第二问题、第三问题的目标问题。基于此,使得得到的第二问题与第一问题考核的知识点属于同一知识面,第三问题与第二问题考核的知识点属于同一知识面,从而层层递进地对面试者进行提问,进而能更加全面地对面试者在该知识面进行考核。
[0010]结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述获取预先建立的问题知识图谱,包括:获取问题集,所述问题集中包括至少两个问题;基于预先训练好的BERT(Bidirectional Encoder Representations from Transformers,来自变压器的双向编码器表示)模型,得到所述问题集中每个问题的知识图谱向量;基于所述每个问题的知识图谱向量,得到所述问题集中任意两个问题的语义相似度;基于所述问题集以及所述问题集中任意两个问题的语义相似度,构建所述问题知识图谱。
[0011]本申请实施例中,通过预先训练好的BERT模型,得到问题集中每个问题的知识图谱向量,然后通过每个问题的知识图谱向量,得到问题集中任意两个问题的语义相似度,进而将问题集中的问题作为问题知识图谱中的节点,语义相似度作为该语义相似度对应的两个问题所在节点的连接关系。由于考核相同知识面的问题中,必然包括相同的词语,因此,考核的知识点越接近的问题的语义相似度越大,因此,将问题间的语义相似度作为问题知识图谱节点间的连接关系,使得得到的问题知识图谱更加符合实际需求,通过获取问题集中每个问题的知识图谱向量,进而得到问题集中任意两个问题的语义相似度,并以此来建立问题知识图谱,使得在面试时,能够快速的找到与第一问题相关的目标问题。
[0012]结合上述第一方面提供的技术方案,在一些可能的实施方式中,所述基于预先训练好的BERT模型,得到所述问题集中每个问题的知识图谱向量,包括:获取所述问题集中每一个问题包括的所有实体;针对每一个问题,基于所述预先训练好的BERT模型和该问题中包括的所有实体,得到该问题中每个实体的语义向量;基于该问题中所有实体的语义向量和预设规则,得到该问题的知识图谱向量。
[0013]本申请实施例中,通过BERT模型得到一个问题中的所有实体的语义向量,再基于该问题所有实体的语义向量和预设规则,得到该问题的知识图谱向量,由于问题的知识图谱向量仅由该问题中的实体决定,可以有效减少语气词、关联词等与考核知识点无关的词语对问题的知识图谱向量的影响,使得知识图谱向量能更准确地表示该问题考核的知识点,进而使得最终得到的问题知识图谱能更加准确地反映不同问题的相关性。
[0014]结合上述第一方面提供的技术方案,在一些可能的实施方式中,训练所述BERT模型的过程,包括:获取训练问题集,所述训练问题集中的每一个问题的实体均标注有真实命名实体标签;将所述训练问题集输入BERT预训练模型,得到所述训练问题集中每个问题包括的字的训练语义向量;将得到的所述训练语义向量输入分类模型,得到每个实体的预测命名实体标签;基于所述真实命名实体标签、所述预测命名实体标签和反向传播算法,更新所述BERT模型和所述分类模型的参数,直至满足预设条件,得到训练好的BERT模型。
[0015]本申请实施例中,在训练BERT模型时,通过引入分类模型来得到每个实体的预测命名实体标签,然后再基于真实命名实体标签、预测命名实体标签和反向传播算法,以此来更新本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题选择方法,其特征在于,包括:获取预先建立的问题知识图谱,所述问题知识图谱包括问题集和所述问题集中任意两个问题的语义相似度,其中,所述问题集中的问题表征所述问题知识图谱中的问题节点,任意两个问题的语义相似度表征对应的两个问题节点的连接关系;从所述问题知识图谱中确定第一问题;从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题;输出所述第一问题和所述目标问题。2.根据权利要求1所述的方法,其特征在于,从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题,包括:从所述问题知识图谱中确定与所述第一问题的语义相似度大于预设阈值的目标问题。3.根据权利要求1所述的方法,其特征在于,从所述问题知识图谱中确定与所述第一问题的语义相似度相关的目标问题,包括:从所述问题知识图谱中确定与所述第一问题的语义相似度大于第一预设阈值的第二问题,并从所述问题知识图谱中将所述第一问题删除,得到第二问题知识图谱;从所述第二问题知识图谱中确定与所述第二问题的语义相似度大于第二预设阈值的第三问题,并从所述第二问题知识图谱中将所述第二问题删除,得到第三问题知识图谱,直至满足预设停止条件;所述目标问题包括所述第二问题、所述第三问题。4.根据权利要求1所述的方法,其特征在于,所述获取预先建立的问题知识图谱,包括:获取问题集,所述问题集中包括至少两个问题;基于预先训练好的BERT模型,得到所述问题集中每个问题的知识图谱向量;基于所述每个问题的知识图谱向量,得到所述问题集中任意两个问题的语义相似度;基于所述问题集以及所述问题集中任意两个问题的语义相似度,构建所述问题知识图谱。5.根据权利要求4所述的方法,其特征在于,所述基于预先训练好的BERT模型,得到所述问题集中每个问题的知识图谱向量,包括:获取所述问题集中每一个问题包括的所有实体;针对每一个问题,基于所述预先训练好的BERT模型和该问题中包括的所有实体,得到该问题中每个实体的语义向量;基于该问题中所有实体的语义向量和预设规则,得到该问题的知识图谱向量。6.根据权利要求4所述的方法,其特征在于,训练所述BERT模型的过程,包括:获取训练问题集,所述训练问题集中的每一个问题的实体均标注有真实命名实体标签;将所述训练问题集输入BERT预训练模型,得到所述训练问题集中每个问题包括的字的训练语义向量;将得到的所述训练语义向量输入分类模型,得到每个实体的预测命名实体标签;基于所述真实命名实体标签、所述预测命名实体标签和反向传播算法,更新所述BERT预训练模型和所述分类模型的参数,直至满足预设条件...

【专利技术属性】
技术研发人员:李海滨郭玮储开龙
申请(专利权)人:湖北天天数链技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1