语义匹配模型训练方法、语义匹配方法及答案获取方法组成比例

技术编号：23533756 阅读：49 留言：0更新日期：2020-03-20 08:00

本申请提供了一种语义匹配模型训练方法、语义匹配方法及答案获取方法，其中，该语义匹配模型训练方法包括：获取样本句组中包含的样本语句的表示向量；其中，每个样本句组包括两个样本语句，以及该两个样本语句是否相似的标注信息；将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型，确定同一样本句组中的样本语句之间的相似度；根据两个样本语句之间的相似度与所述标注信息的比对结果，对所述语义匹配模型进行本轮训练；经过对所述基础模型的多轮训练，获取所述语义配模型。本申请解决无法实现对含义类似但表述方式不同的语句之间的精确匹配的问题，进而达到够更好的实现表述不同的相似语句之间的匹配的效果。

Semantic matching model training method, semantic matching method and answer acquisition method

全部详细技术资料下载

【技术实现步骤摘要】
语义匹配模型训练方法、语义匹配方法及答案获取方法
本申请涉及自然语言处理
，具体而言，涉及一种语义匹配模型训练方法、语义匹配方法及答案获取方法。
技术介绍
在自然语言处理领域，现有的语言模型通常依赖于机器学习算法。机器学习的本质是预测；在通过大量的训练数据集对机器学习模型进行训练，得到自然语言处理模型后，就能够将待处理数据输入至训练好的自然语言处理模型，获得与待处理数据对应的预测结果。检索式问答模型是自然语言处理模型中一个非常重要的分支。检索式问答模型能够通过对文本进行关联匹配，根据问题从备选答案中匹配与问题对应的答案。但是当前的检索式问答模型在对问题和备选答案进行匹配的时候，无法对意图相同但表述方式不同的问题和备选答案进行精确的匹配，无法满足当前用户使用需求。
技术实现思路
有鉴于此，本申请实施例的目的在于提供语义匹配模型训练方法、语义匹配方法及答案获取方法，能够通过对意图相同但表述方式不同的问题和备选答案进行精确的匹配，满足用户的使用需求。第一方面，本申请实施例提供了一种语义匹配模型训练方法，包括：获取样本句组中包含的样本语句的表示向量；其中，每个样本句组包括两个样本语句，以及该两个样本语句是否相似的标注信息；将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型，确定同一样本句组中的样本语句之间的相似度；根据两个样本语句之间的相似度与所述标注信息的比对结果，对所述语义匹配模型进行本轮训练；经过对所述基础模型的多轮训练，获取...

【技术保护点】
1.一种语义匹配模型训练方法，其特征在于，包括：/n获取样本句组中包含的样本语句的表示向量；其中，每个样本句组包括两个样本语句，以及该两个样本语句是否相似的标注信息；/n将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型，确定同一样本句组中的样本语句之间的相似度；/n根据两个样本语句之间的相似度与所述标注信息的比对结果，对所述语义匹配模型进行本轮训练；/n经过对所述基础模型的多轮训练，获取所述语义配模型。/n

【技术特征摘要】
1.一种语义匹配模型训练方法，其特征在于，包括：
获取样本句组中包含的样本语句的表示向量；其中，每个样本句组包括两个样本语句，以及该两个样本语句是否相似的标注信息；
将同一样本句组中的样本语句的表示向量输入预先构建的语义匹配模型，确定同一样本句组中的样本语句之间的相似度；
根据两个样本语句之间的相似度与所述标注信息的比对结果，对所述语义匹配模型进行本轮训练；
经过对所述基础模型的多轮训练，获取所述语义配模型。

2.根据权利要求1所述的方法，其特征在于，所述语义匹配模型包括：循环神经网络；
所述确定同一样本句组中的样本语句之间的相似度，包括：
将同一样本句组中的样本语句的表示向量输入循环神经网络，使用所述循环神经网络对所述表示向量进行编码处理，确定每个样本语句的编码向量；其中，所述同一样本句组中的样本语句使用相同编码参数；
根据所述样本语句的编码向量，确定两个样本语句之间的相似度。

3.根据权利要求2所述的方法，其特征在于，所述语义匹配模型还包括：多层感知神经网络；
所述根据所述样本语句的编码向量，确定两个样本语句之间的相似度，包括：
将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络，确定两个样本语句之间的相似度。

4.根据权利要求2所述的方法，其特征在于，所述语义匹配模型还包括：线性映射网络；
所述将同一样本句组中的样本语句的表示向量输入循环神经网络之前，还包括：
将所述样本语句的表示向量输入所述线性映射网络，对所述样本语句的表示向量进行线性压缩；
所述使用所述循环神经网络对所述表示向量进行编码处理，具体包括：
使用所述循环神经网络对进行线性压缩之后的表示向量进行编码处理。

5.根据权利要求4所述的方法，其特征在于，所述对所述样本语句的表示向量进行线性压缩，具体包括：
使用神经网络对所述表示向量中的各个词向量进行卷积处理，以降低每个词向量的维度；其中，卷积处理过程中使用的卷积核数量为降低后的目标维度；
将进行了卷积处理的词向量构成的向量，确定为进行了线性压缩的表示向量。

6.根据权利要求2所述的方法，其特征在于，所述多层感知神经网络包括：匹配网络层、感知层以及输出层；
所述将同一样本句组的样本语句的编码向量输入至所述多层感知神经网络，确定两个样本语句之间的相似度，具体包括：
属于同一样本句组的两个样本语句的编码向量输入至所述网络匹配层，计算两个编码向量在多种距离特征下的距离值；
将两个编码向量在多种距离特征下的特征值输入至所述感知层，计算两个编码向量在多组参数下...

【专利技术属性】
技术研发人员：蔡世清，郑凯，段立新，江建军，
申请(专利权)人：国信优易数据有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人