模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号：31910952 阅读：14 留言：0更新日期：2022-01-15 12:51

本发明专利技术实施例提供一种模型训练方法、装置、设备和存储介质，该方法包括：获取多组问题对，其中，每组问题对包括用户输入问题以及参考问题，每组问题中的用户输入问题与参考问题是语义相关的；确定不同组问题对中用户输入问题之间的第一相关度，以及确定不同组问题对中参考问题之间的第二相关度；基于第一相关度和第二相关度，对多组问题对进行滤除；将经过滤除处理的问题对作为训练样本，对语言模型进行训练。采用本发明专利技术实施例提供的方法训练出的语言模型能够更好地建模用户输入问题和参考问题之间的深层语义关系，即使用户在输入问题的过程中掺杂了非必要的描述，语言模型也依然能够根据用户输入问题的深层语义关系匹配到正确的参考问题。确的参考问题。确的参考问题。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、设备和存储介质

[0001]本专利技术涉及机器学习模型
，尤其涉及一种模型训练方法、装置、设备和存储介质。

技术介绍

[0002]随着科技的发展，依靠人力完成的工作越来越多的交给了机器来完成。例如，可以通过人机对话功能让机器根据用户问的问题自动输出答案。相关技术中，是通过字词匹配的方法在问题数据库中，为用户问的问题匹配语义相近的参考问题，然后将参考问题对应的答案输出给用户。字词匹配的方法较为简单，但是如果用户使用比较复杂的描述来说明问题，则很难再通过字词匹配的方法找到与用户问的问题相匹配的参考问题。

技术实现思路

[0003]本专利技术实施例提供一种模型训练方法、装置、设备和存储介质，用以实现即使用户在输入问题的过程中掺杂了非必要的描述，依然能够为用户输入的问题匹配到正确的参考问题。
[0004]第一方面，本专利技术实施例提供一种模型训练方法，该方法包括：
[0005]获取多组问题对，其中，每组问题对包括用户输入问题以及参考问题，每组问题中的用户输入问题与参考问题是语义相关的；
[0006]确定不同组问题对中用户输入问题之间的第一相关度，以及确定不同组问题对中参考问题之间的第二相关度；
[0007]基于所述第一相关度和所述第二相关度，对所述多组问题对进行滤除；
[0008]将经过滤除处理的问题对作为训练样本，对语言模型进行训练。
[0009]第二方面，本专利技术实施例提供一种模型训练装置，包括：
[0010]获取模块，用...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取多组问题对，其中，每组问题对包括用户输入问题以及参考问题，每组问题中的用户输入问题与参考问题是语义相关的；确定不同组问题对中用户输入问题之间的第一相关度，以及确定不同组问题对中参考问题之间的第二相关度；基于所述第一相关度和所述第二相关度，对所述多组问题对进行滤除；将经过滤除处理的问题对作为训练样本，对语言模型进行训练。2.根据权利要求1所述的方法，其特征在于，在基于所述第一相关度和所述第二相关度，对所述多组问题对进行滤除之后，所述方法还包括：基于经过滤除处理的不同组问题对中的用户输入问题和非参考问题，生成多组第一负样本问题对；所述将经过滤除处理的问题对作为训练样本，对语言模型进行训练，包括：将经过滤除处理的问题对和所述多组第一负样本问题对作为训练样本，对语言模型进行训练。3.根据权利要求2所述的方法，其特征在于，在将经过滤除处理的问题对和所述多组第一负样本问题对作为训练样本，对语言模型进行训练之前，所述方法还包括：基于未经过滤除处理的问题对中的用户输入问题和非参考问题，生成多组第二负样本问题对；将所述未经过滤除处理的问题对和所述多组第二负样本问题对作为训练样本，对语言模型进行训练；所述将经过滤除处理的问题对和所述多组第一负样本问题对作为训练样本，对语言模型进行训练，包括：将经过滤除处理的问题对和所述多组第一负样本问题对作为训练样本，对所述语言模型进行优化训练。4.根据权利要求3所述的方法，其特征在于，所述确定不同组问题对中用户输入问题之间的第一相关度，以及确定不同组问题对中参考问题之间的第二相关度，包括：将所述多组问题对中的用户输入问题分别输入到优化训练前的语言模型中的第一转换子模型中，得到所述多组问题对中的用户输入问题各自对应的第一语义向量；基于所述第一语义向量，确定不同组问题对中用户输入问题之间的第一相关度；将所述多组问题对中的参考问题分别输入到所述优化训练前的语言模型中的第二转换子模型中，得到所述多组问题对中的参考问题各自对应的第二语义向量；基于所述第二语义向量，确定不同组问题对中参考问题之间的第二相关度。5.根据权利要求4所述的方法，其特征在于，所述基于所述第一语义向量，确定不同组问题对中用户输入问题之间的第一相关度，包括：确定不同组问题对中每两个用户输入问题对应的第一语义向量之间的第一余弦距离，作为不同组问题...

【专利技术属性】
技术研发人员：谢韬，秦昌博，
申请(专利权)人：科沃斯商用机器人有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人