语义匹配模型训练方法、语义匹配方法及答案获取方法组成比例

技术编号:23533756 阅读:49 留言:0更新日期:2020-03-20 08:00
本申请提供了一种语义匹配模型训练方法、语义匹配方法及答案获取方法,其中,该语义匹配模型训练方法包括:获取样本句组中包含的样本语句的表示向量;其中,每个样本句组包括两个样本语句,以及该两个样本语句是否相似的标注信息;将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型,确定同一样本句组中的样本语句之间的相似度;根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述语义匹配模型进行本轮训练;经过对所述基础模型的多轮训练,获取所述语义配模型。本申请解决无法实现对含义类似但表述方式不同的语句之间的精确匹配的问题,进而达到够更好的实现表述不同的相似语句之间的匹配的效果。

Semantic matching model training method, semantic matching method and answer acquisition method

【技术实现步骤摘要】
语义匹配模型训练方法、语义匹配方法及答案获取方法
本申请涉及自然语言处理
,具体而言,涉及一种语义匹配模型训练方法、语义匹配方法及答案获取方法。
技术介绍
在自然语言处理领域,现有的语言模型通常依赖于机器学习算法。机器学习的本质是预测;在通过大量的训练数据集对机器学习模型进行训练,得到自然语言处理模型后,就能够将待处理数据输入至训练好的自然语言处理模型,获得与待处理数据对应的预测结果。检索式问答模型是自然语言处理模型中一个非常重要的分支。检索式问答模型能够通过对文本进行关联匹配,根据问题从备选答案中匹配与问题对应的答案。但是当前的检索式问答模型在对问题和备选答案进行匹配的时候,无法对意图相同但表述方式不同的问题和备选答案进行精确的匹配,无法满足当前用户使用需求。
技术实现思路
有鉴于此,本申请实施例的目的在于提供语义匹配模型训练方法、语义匹配方法及答案获取方法,能够通过对意图相同但表述方式不同的问题和备选答案进行精确的匹配,满足用户的使用需求。第一方面,本申请实施例提供了一种语义匹配模型训练方法,包括:获取样本句组中包含的样本语句的表示向量;其中,每个样本句组包括两个样本语句,以及该两个样本语句是否相似的标注信息;将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型,确定同一样本句组中的样本语句之间的相似度;根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述语义匹配模型进行本轮训练;经过对所述基础模型的多轮训练,获取所述语义配模型。可选地,所述语义匹配模型包括:循环神经网络;所述确定同一样本句组中的样本语句之间的相似度,包括:将同一样本句组中的样本语句的表示向量输入循环神经网络,使用所述循环神经网络对所述表示向量进行编码处理,确定每个样本语句的编码向量;其中,所述同一样本句组中的样本语句使用相同编码参数;根据所述样本语句的编码向量,确定两个样本语句之间的相似度。可选地,所述语义匹配模型还包括:多层感知神经网络;所述根据所述样本语句的编码向量,确定两个样本语句之间的相似度,包括:将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络,确定两个样本语句之间的相似度。可选地,所述语义匹配模型还包括:线性映射网络;所述将同一样本句组中的样本语句的表示向量输入循环神经网络之前,还包括:将所述样本语句的表示向量输入所述线性映射网络,对所述样本语句的表示向量进行线性压缩;所述使用所述循环神经网络对所述表示向量进行编码处理,具体包括:使用所述循环神经网络对进行线性压缩之后的表示向量进行编码处理。可选地,所述对所述样本语句的表示向量进行线性压缩,具体包括:使用神经网络对所述表示向量中的各个词向量进行卷积处理,以降低每个词向量的维度;其中,卷积处理过程中使用的卷积核数量为降低后的目标维度;将进行了卷积处理的词向量构成的向量,确定为进行了线性压缩的表示向量。可选地,所述多层感知神经网络包括:匹配网络层、感知层以及输出层;所述将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络,确定两个样本语句之间的相似度,具体包括:属于同一样本句组的两个样本语句的编码向量输入至所述网络匹配层,计算两个编码向量在多种距离特征下的距离值;将两个编码向量在多种距离特征下的特征值输入至所述感知层,计算两个编码向量在多组参数下,分别与每组参数对应的混合距离;将各组参数对应的混合距离输入至所述输出层,计算两个样本语句之间的相似度。可选地,所述根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述语义匹配模型进行本轮训练,具体包括:执行下述第一比对操作,直至两个样本语句之间的相似度与所述标注信息之间的交叉熵损失不大于预设的交叉熵损失阈值;所述第一比对操作包括:基于两个样本语句之间的相似度与所述标注信息,确定所述交叉熵损失;将所述交叉熵损失与预设的交叉熵损失阈值进行比对;针对所述交叉熵损失大于交叉熵损失阈值的情况,调整所述语义匹配模型的参数;基于调整参数后的语义匹配模型重新获取同一样本句组中的样本句之间的相似度,并重新执行所述第一比对操作。可选地,所述根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述基础模型进行本轮训练,具体包括:执行下述第二比对操作,直至两个样本语句之间的相似度与所述标注信息之间的交叉熵损失不大于预设的交叉熵损失阈值;所述第二比对操作包括:基于两个样本语句之间的相似度与所述标注信息,确定交叉熵损失;将所述交叉熵损失与预设的交叉熵损失阈值进行比对;针对所述交叉熵损失大于交叉熵损失阈值的情况,调整所述循环神经网络、所述多层感知神经网络以及所述线性映射网络的参数;基于调整参数后的线性映射网络重新对所述样本语句的表示向量进行线性压缩;基于调整参数后的循环神经网络对进行线性压缩之后的表示向量进行编码处理,获取每个样本语句的新的编码向量;以及将同一样本句组的样本语句的新的编码向量输入至所述多层感知神经网络,确定两个样本语句之间的相似度,并重新执行所述第二比对操作。第二方面,本申请实施例还提供一种语义匹配方法,该方法包括:获取待匹配语句;将所述待匹配语句依次与多个预先设置的被匹配语句输入至通过权利要求1-8任意一项所述的语义匹配模型训练方法得到的语义匹配模型中,得到所述待匹配语句与每个所述被匹配语句的匹配度;将与所述待匹配语句匹配度最大的所述被匹配语句作为所述待匹配语句的匹配语句。第三方面,本申请实施例还提供一种答案获取方法,该方法包括:获取待匹配问题;将所述待匹配问题依次与多个预先设置的被匹配问题输入至通过权利要求1-8任意一项所述的语义匹配模型训练方法得到的语义匹配模型中,得到所述待匹配问题与每个所述被匹配问题的匹配度;将与所述待匹配问题匹配度最大的所述被匹配问题对应的答案,作为所述待匹配问题的答案。第四方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可能的实施方式中的步骤。第五方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可能的实施方式中的步骤。本申请实施例中,在获取样本句组中包括的样本语句的表示向量后,将属于同一样本句组中的两个样本语句的表示向量输入到预先构建的语义匹配模型,确定两个样本语句之间的相似度,然后根据样本语句之间的相似度与样本具足的标注信息的比对结果,对语义匹配网络模型进行本轮训练,在整个对模型进行训练的过程中,是直接获取样本文档来自技高网...

【技术保护点】
1.一种语义匹配模型训练方法,其特征在于,包括:/n获取样本句组中包含的样本语句的表示向量;其中,每个样本句组包括两个样本语句,以及该两个样本语句是否相似的标注信息;/n将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型,确定同一样本句组中的样本语句之间的相似度;/n根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述语义匹配模型进行本轮训练;/n经过对所述基础模型的多轮训练,获取所述语义配模型。/n

【技术特征摘要】
1.一种语义匹配模型训练方法,其特征在于,包括:
获取样本句组中包含的样本语句的表示向量;其中,每个样本句组包括两个样本语句,以及该两个样本语句是否相似的标注信息;
将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型,确定同一样本句组中的样本语句之间的相似度;
根据两个样本语句之间的相似度与所述标注信息的比对结果,对所述语义匹配模型进行本轮训练;
经过对所述基础模型的多轮训练,获取所述语义配模型。


2.根据权利要求1所述的方法,其特征在于,所述语义匹配模型包括:循环神经网络;
所述确定同一样本句组中的样本语句之间的相似度,包括:
将同一样本句组中的样本语句的表示向量输入循环神经网络,使用所述循环神经网络对所述表示向量进行编码处理,确定每个样本语句的编码向量;其中,所述同一样本句组中的样本语句使用相同编码参数;
根据所述样本语句的编码向量,确定两个样本语句之间的相似度。


3.根据权利要求2所述的方法,其特征在于,所述语义匹配模型还包括:多层感知神经网络;
所述根据所述样本语句的编码向量,确定两个样本语句之间的相似度,包括:
将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络,确定两个样本语句之间的相似度。


4.根据权利要求2所述的方法,其特征在于,所述语义匹配模型还包括:线性映射网络;
所述将同一样本句组中的样本语句的表示向量输入循环神经网络之前,还包括:
将所述样本语句的表示向量输入所述线性映射网络,对所述样本语句的表示向量进行线性压缩;
所述使用所述循环神经网络对所述表示向量进行编码处理,具体包括:
使用所述循环神经网络对进行线性压缩之后的表示向量进行编码处理。


5.根据权利要求4所述的方法,其特征在于,所述对所述样本语句的表示向量进行线性压缩,具体包括:
使用神经网络对所述表示向量中的各个词向量进行卷积处理,以降低每个词向量的维度;其中,卷积处理过程中使用的卷积核数量为降低后的目标维度;
将进行了卷积处理的词向量构成的向量,确定为进行了线性压缩的表示向量。


6.根据权利要求2所述的方法,其特征在于,所述多层感知神经网络包括:匹配网络层、感知层以及输出层;
所述将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络,确定两个样本语句之间的相似度,具体包括:
属于同一样本句组的两个样本语句的编码向量输入至所述网络匹配层,计算两个编码向量在多种距离特征下的距离值;
将两个编码向量在多种距离特征下的特征值输入至所述感知层,计算两个编码向量在多组参数下...

【专利技术属性】
技术研发人员:蔡世清郑凯段立新江建军
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1