模型训练、对话数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：35098069 阅读：16 留言：0更新日期：2022-10-01 17:02

本公开涉及一种模型训练、对话数据处理方法、装置、设备及存储介质。本公开通过机器学习模型对对话上文进行编码得到第一编码结果。根据该第一编码结果，确定出该对话上文对应的语义向量。从而使得回复选择任务可以根据该语义向量计算该对话上文和目标回复之间的第一语义距离、以及计算该对话上文和非目标回复之间的第二语义距离。使得回复生成任务可以根据该语义向量预测该对话上文对应的目标回复，并计算预测的目标回复和正样本中的目标回复之间的差异。根据第一语义距离、第二语义距离和该差异对机器学习模型进行训练。本实施例可以同时采用回复生成任务和回复选择任务来进行对话结构学习，可以充分利用对话的特有信息，充分的学习对话结构。分的学习对话结构。分的学习对话结构。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练、对话数据处理方法、装置、设备及存储介质

[0001]本公开涉及信息
，尤其涉及一种模型训练、对话数据处理方法、装置、设备及存储介质。

技术介绍

[0002]对话结构学习是指学习对话的语义、动作等状态，并学习状态之间的转移关系，从而结构化的理解对话过程。
[0003]但是，本申请的专利技术人发现，现有的对话结构学习方法无法充分的利用对话特有的信息，从而导致对话结构学习不充分。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种模型训练、对话数据处理方法、装置、设备及存储介质，通过同时采用回复生成任务和回复选择任务来进行对话结构学习，以充分利用对话的特有信息，充分的学习对话结构。
[0005]第一方面，本公开实施例提供一种模型训练方法，包括：
[0006]获取正样本、以及所述正样本对应的至少一个负样本，所述正样本中的前N个轮次的对话文本与所述负样本中的前N个轮次的对话文本相同，所述正样本中的第N+1个轮次的对话文本与所述负样本中的第N+1个轮次的对话文本不同，N大于或等于1；
[0007]通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果；
[0008]根据所述第一编码结果，确定所述前N个轮次的对话文本对应的语义向量；
[0009]通过机器学习模型中的回复选择任务计算所述语义向量与所述正样本中的第N+1个轮次的对话文本之间的第一语义距离、以及所述语义向量分别与每个负样本中的第N+1个...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其中，所述方法包括：获取正样本、以及所述正样本对应的至少一个负样本，所述正样本中的前N个轮次的对话文本与所述负样本中的前N个轮次的对话文本相同，所述正样本中的第N+1个轮次的对话文本与所述负样本中的第N+1个轮次的对话文本不同，N大于或等于1；通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果；根据所述第一编码结果，确定所述前N个轮次的对话文本对应的语义向量；通过机器学习模型中的回复选择任务计算所述语义向量与所述正样本中的第N+1个轮次的对话文本之间的第一语义距离、以及所述语义向量分别与每个负样本中的第N+1个轮次的对话文本之间的第二语义距离；通过所述机器学习模型中的回复生成任务预测所述语义向量对应的目标回复，并计算所述目标回复和所述正样本中的第N+1个轮次的对话文本之间的差异；根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练。2.根据权利要求1所述的方法，其中，根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练，包括：根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型中的所述回复选择任务和所述回复生成任务进行联合训练。3.根据权利要求1所述的方法，其中，通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果，包括：通过机器学习模型对所述前N个轮次中每一个轮次的对话文本分别进行编码，得到所述每一个轮次的对话文本分别对应的第二编码结果；根据所述每一个轮次的对话文本分别对应的第二编码结果，确定所述第一编码结果。4.根据权利要求1所述的方法，其中，通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果，包括：对于所述前N个轮次中每一个轮次的对话文本，在所述轮次的对话文本的首位增加预设字符，并通过所述机器学习模型计算所述轮次的对话文本的表示向量，得到所述轮次对应的预设字符的表示向量；根据所述前N个轮次中每一个轮次分别对应的预设字符的表示向量，确定所述第一编码结果。5.根据权利要求1所述的方法，其中，根据所述第一编码结果，确定所述前N个轮次的对话文本对应的语义向量，包括：将所述第一编码结果转换为一个多维向量；确定所述多维向量中的最大值在所述多维向量中的索引，将所述最大值的索引对应的初始化表示向量确定为所述前N个轮次的对话文本对应的语义向量。6.一种对话数据处理方法，其中，所述方法包括：获取对话数据，所述对话数据包括多个轮次的对话文本；向预先训练后的机器学习模型多次输入对话文本，第n次向所述机器学习模型输入的对话文本是所述多个轮次中前n个轮次的对话文本，所述机器学习模型用于计算每次输入的对话文本对应的多维向量，并根据所述每次输入的对话文本对应的多维向量确定所述每

【专利技术属性】
技术研发人员：刘澈，李永彬，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人