模型训练、对话数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:35098069 阅读:16 留言:0更新日期:2022-10-01 17:02
本公开涉及一种模型训练、对话数据处理方法、装置、设备及存储介质。本公开通过机器学习模型对对话上文进行编码得到第一编码结果。根据该第一编码结果,确定出该对话上文对应的语义向量。从而使得回复选择任务可以根据该语义向量计算该对话上文和目标回复之间的第一语义距离、以及计算该对话上文和非目标回复之间的第二语义距离。使得回复生成任务可以根据该语义向量预测该对话上文对应的目标回复,并计算预测的目标回复和正样本中的目标回复之间的差异。根据第一语义距离、第二语义距离和该差异对机器学习模型进行训练。本实施例可以同时采用回复生成任务和回复选择任务来进行对话结构学习,可以充分利用对话的特有信息,充分的学习对话结构。分的学习对话结构。分的学习对话结构。

【技术实现步骤摘要】
模型训练、对话数据处理方法、装置、设备及存储介质


[0001]本公开涉及信息
,尤其涉及一种模型训练、对话数据处理方法、装置、设备及存储介质。

技术介绍

[0002]对话结构学习是指学习对话的语义、动作等状态,并学习状态之间的转移关系,从而结构化的理解对话过程。
[0003]但是,本申请的专利技术人发现,现有的对话结构学习方法无法充分的利用对话特有的信息,从而导致对话结构学习不充分。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种模型训练、对话数据处理方法、装置、设备及存储介质,通过同时采用回复生成任务和回复选择任务来进行对话结构学习,以充分利用对话的特有信息,充分的学习对话结构。
[0005]第一方面,本公开实施例提供一种模型训练方法,包括:
[0006]获取正样本、以及所述正样本对应的至少一个负样本,所述正样本中的前N个轮次的对话文本与所述负样本中的前N个轮次的对话文本相同,所述正样本中的第N+1个轮次的对话文本与所述负样本中的第N+1个轮次的对话文本不同,N大于或等于1;
[0007]通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果;
[0008]根据所述第一编码结果,确定所述前N个轮次的对话文本对应的语义向量;
[0009]通过机器学习模型中的回复选择任务计算所述语义向量与所述正样本中的第N+1个轮次的对话文本之间的第一语义距离、以及所述语义向量分别与每个负样本中的第N+1个轮次的对话文本之间的第二语义距离;
[0010]通过所述机器学习模型中的回复生成任务预测所述语义向量对应的目标回复,并计算所述目标回复和所述正样本中的第N+1个轮次的对话文本之间的差异;
[0011]根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练。
[0012]第二方面,本公开实施例提供一种对话数据处理方法,包括:
[0013]获取对话数据,所述对话数据包括多个轮次的对话文本;
[0014]向预先训练后的机器学习模型多次输入对话文本,第n次向所述机器学习模型输入的对话文本是所述多个轮次中前n个轮次的对话文本,所述机器学习模型用于计算每次输入的对话文本对应的多维向量,并根据所述每次输入的对话文本对应的多维向量确定所述每次输入的对话文本的状态,所述机器学习模型是根据如上所述的模型训练方法训练得到的模型,n大于或等于1;
[0015]根据所述每次输入的对话文本的状态、以及不同状态之间的转移关系,确定所述对话数据的对话结构。
[0016]第三方面,本公开实施例提供一种模型训练装置,包括:
[0017]获取模块,用于获取正样本、以及所述正样本对应的至少一个负样本,所述正样本中的前N个轮次的对话文本与所述负样本中的前N个轮次的对话文本相同,所述正样本中的第N+1个轮次的对话文本与所述负样本中的第N+1个轮次的对话文本不同,N大于或等于1;
[0018]编码模块,用于通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果;
[0019]确定模块,用于根据所述第一编码结果,确定所述前N个轮次的对话文本对应的语义向量;
[0020]第一计算模块,用于通过机器学习模型中的回复选择任务计算所述语义向量与所述正样本中的第N+1个轮次的对话文本之间的第一语义距离、以及所述语义向量分别与每个负样本中的第N+1个轮次的对话文本之间的第二语义距离;
[0021]第二计算模块,用于通过所述机器学习模型中的回复生成任务预测所述语义向量对应的目标回复,并计算所述目标回复和所述正样本中的第N+1个轮次的对话文本之间的差异;
[0022]训练模块,用于根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练。
[0023]第四方面,本公开实施例提供一种对话数据处理装置,包括:
[0024]获取模块,用于获取对话数据,所述对话数据包括多个轮次的对话文本;
[0025]输入模块,用于向预先训练后的机器学习模型多次输入对话文本,第n次向所述机器学习模型输入的对话文本是所述多个轮次中前n个轮次的对话文本,所述机器学习模型用于计算每次输入的对话文本对应的多维向量,并根据所述每次输入的对话文本对应的多维向量确定所述每次输入的对话文本的状态,所述机器学习模型是根据如上所述的模型训练方法训练得到的模型,n大于或等于1;
[0026]确定模块,用于根据所述每次输入的对话文本的状态、以及不同状态之间的转移关系,确定所述对话数据的对话结构。
[0027]第五方面,本公开实施例提供一种电子设备,包括:
[0028]存储器;
[0029]处理器;以及
[0030]计算机程序;
[0031]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面或第二方面所述的方法。
[0032]第六方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面或第二方面所述的方法。
[0033]本公开实施例提供的模型训练、对话数据处理方法、装置、设备及存储介质,通过获取正样本和该正样本对应的至少一个负样本,然后通过机器学习模型对该正样本和该至少一个负样本相同的部分即对话上文进行编码得到第一编码结果。进一步,根据该第一编码结果,确定出该对话上文对应的语义向量。从而使得该机器学习模型中的回复选择任务可以根据该语义向量计算该对话上文和该正样本中的目标回复之间的第一语义距离、以及计算该对话上文和该至少一个负样本中每个负样本分别包括的非目标回复之间的第二语
义距离。另外,使得机器学习模型中的回复生成任务可以根据该语义向量预测该对话上文对应的目标回复,并计算预测的目标回复和正样本中的目标回复之间的差异。进一步根据第一语义距离、第二语义距离和该差异对机器学习模型进行训练。使得训练后的机器学习模型可以同时具备目标选择功能和目标生成功能。相比于现有技术中对话结构学习主要依赖回复生成任务来完成对话结构学习,而忽略了回复选择任务,本实施例可以同时采用回复生成任务和回复选择任务来进行对话结构学习,因此,可以充分利用对话的特有信息,充分的学习对话结构,从而结构化的理解对话过程,特别是有助于改善对话目标漂移的问题,实现可控对话的目标。
附图说明
[0034]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0035]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0036]图1为本公开实施例提供的模型训练方法流程图;
[0037]图2为本公开实施例提供的应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其中,所述方法包括:获取正样本、以及所述正样本对应的至少一个负样本,所述正样本中的前N个轮次的对话文本与所述负样本中的前N个轮次的对话文本相同,所述正样本中的第N+1个轮次的对话文本与所述负样本中的第N+1个轮次的对话文本不同,N大于或等于1;通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果;根据所述第一编码结果,确定所述前N个轮次的对话文本对应的语义向量;通过机器学习模型中的回复选择任务计算所述语义向量与所述正样本中的第N+1个轮次的对话文本之间的第一语义距离、以及所述语义向量分别与每个负样本中的第N+1个轮次的对话文本之间的第二语义距离;通过所述机器学习模型中的回复生成任务预测所述语义向量对应的目标回复,并计算所述目标回复和所述正样本中的第N+1个轮次的对话文本之间的差异;根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练。2.根据权利要求1所述的方法,其中,根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型进行训练,包括:根据所述第一语义距离、所述第二语义距离和所述差异对所述机器学习模型中的所述回复选择任务和所述回复生成任务进行联合训练。3.根据权利要求1所述的方法,其中,通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果,包括:通过机器学习模型对所述前N个轮次中每一个轮次的对话文本分别进行编码,得到所述每一个轮次的对话文本分别对应的第二编码结果;根据所述每一个轮次的对话文本分别对应的第二编码结果,确定所述第一编码结果。4.根据权利要求1所述的方法,其中,通过机器学习模型对所述前N个轮次的对话文本进行编码得到第一编码结果,包括:对于所述前N个轮次中每一个轮次的对话文本,在所述轮次的对话文本的首位增加预设字符,并通过所述机器学习模型计算所述轮次的对话文本的表示向量,得到所述轮次对应的预设字符的表示向量;根据所述前N个轮次中每一个轮次分别对应的预设字符的表示向量,确定所述第一编码结果。5.根据权利要求1所述的方法,其中,根据所述第一编码结果,确定所述前N个轮次的对话文本对应的语义向量,包括:将所述第一编码结果转换为一个多维向量;确定所述多维向量中的最大值在所述多维向量中的索引,将所述最大值的索引对应的初始化表示向量确定为所述前N个轮次的对话文本对应的语义向量。6.一种对话数据处理方法,其中,所述方法包括:获取对话数据,所述对话数据包括多个轮次的对话文本;向预先训练后的机器学习模型多次输入对话文本,第n次向所述机器学习模型输入的对话文本是所述多个轮次中前n个轮次的对话文本,所述机器学习模型用于计算每次输入的对话文本对应的多维向量,并根据所述每次输入的对话文本对应的多维向量确定所述每

【专利技术属性】
技术研发人员:刘澈李永彬
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1