【技术实现步骤摘要】
相关性识别模型的训练方法、相关性识别方法及设备
[0001]本申请实施例涉及计算机
,特别涉及一种相关性识别模型的训练方法、相关性识别方法及设备。
技术介绍
[0002]在计算机
中,多种任务均涉及相关性识别。例如,在搜索任务中,相关性识别主要用于从候选结果中识别出与搜索词相关的搜索结果,而在问答任务中,相关性识别主要用于从候选答案中识别出与问题相关的答案。通常情况下,可以训练得到相关性识别模型,以利用相关性识别模型来进行相关性识别。
[0003]相关技术中,可以获取样本文本对,样本文本对包括两个样本文本。一方面,通过对样本文本对进行标注,得到样本文本对中的两个样本文本之间的标注相关性。另一方面,将样本文本对输入神经网络模型,由神经网络模型确定样本文本对中的两个样本文本之间的预测相关性。利用预测相关性和标注相关性对神经网络模型进行训练,得到相关性识别模型。
[0004]上述技术训练得到的相关性识别模型的泛化能力差,导致相关性识别模型的准确性较低,影响了相关性识别结果的准确性。
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种相关性识别模型的训练方法,其特征在于,所述方法包括:获取样本文本对和所述样本文本对中的两个样本文本的标注相关性;控制神经网络模型确定所述样本文本对中的两个样本文本的预测相关性;获取知识图谱,所述知识图谱包括多个节点,所述节点表征基础文本;对于所述样本文本对中的任一个样本文本,从所述知识图谱中采样出所述任一个样本文本对应的第一文本和第二文本中的至少一项,所述任一个样本文本对应的第一文本是与所述任一个样本文本相关的基础文本,所述任一个样本文本对应的第二文本是与所述任一个样本文本不相关的基础文本;基于所述样本文本对中的至少一个样本文本对应的第一文本和第二文本中的至少一项,以及所述标注相关性和所述预测相关性,对所述神经网络模型进行训练,得到相关性识别模型。2.根据权利要求1所述的方法,其特征在于,所述知识图谱还包括多个边,所述边表征两端节点对应的基础文本之间的语义关系;从所述知识图谱中采样出所述任一个样本文本对应的第一文本,包括:在所述知识图谱中确定目标节点,所述目标节点对应的基础文本为所述任一个样本文本;在所述知识图谱中确定至少一个第一边,所述第一边的一端节点为所述目标节点,所述任一个样本文本的语义包含或者等同于所述第一边的另一端节点对应的基础文本的语义;从各个第一边的另一端节点对应的基础文本中,采样出所述任一个样本文本对应的第一文本。3.根据权利要求1所述的方法,其特征在于,所述知识图谱还包括多个边,所述边表征两端节点对应的基础文本之间的语义关系;从所述知识图谱中采样出所述任一个样本文本对应的第二文本,包括:在所述知识图谱中确定目标节点,所述目标节点对应的基础文本为所述任一个样本文本;在所述知识图谱中确定至少一个第一边,所述第一边的一端节点为所述目标节点,所述任一个样本文本的语义包含或者等同于所述第一边的另一端节点对应的基础文本的语义;从第一节点对应的基础文本中采样出所述任一个样本文本对应的第二文本,所述第一节点是所述知识图谱中除各个第一边的两端节点之外的节点。4.根据权利要求1所述的方法,其特征在于,所述知识图谱还包括多个边,所述边表征两端节点对应的基础文本之间的类别关系;从所述知识图谱中采样出所述任一个样本文本对应的第一文本,包括:在所述知识图谱中确定目标节点,所述目标节点对应的基础文本为所述任一个样本文本;在所述知识图谱中确定至少一个第二边,所述第二边的一端节点为所述目标节点,所述任一个样本文本的类别与所述第二边的另一端节点对应的基础文本的类别相同;从各个第二边的另一端节点对应的基础文本中,采样出所述任一个样本文本对应的第
一文本。5.根据权利要求1所述的方法,其特征在于,所述知识图谱还包括多个边,所述边表征两端节点对应的基础文本之间的类别关系;从...
【专利技术属性】
技术研发人员:陈凤娇,宋秀杰,曹雪智,武威,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。