【技术实现步骤摘要】
一种多轮对话意图识别模型的训练方法、装置及设备
[0001]本申请属于计算机应用
,尤其涉及一种多轮对话意图识别模型的训练方法、装置及设备。
技术介绍
[0002]在聊天系统中,一般将一个对话方从开始发出信息到其他人开始发出信息定义为这个信息发出者的一轮消息。目前常见的对话意图识别方法是采用神经网络模型进行识别,由于在训练过程中,样本一般采用一轮对话及其对应的一个语义。所以,训练得到的对话意图识别模型在使用时一轮对话只会输出一个语义,在对话过程中一轮对话的消息可能不止一个语义,而不止一个语义的消息在对话中可能意味着后续需要多种回复。
[0003]采用现有的模型训练方法训练得到的对话意图识别模型,在实际应用时部分对话中的意图信息可能会被舍弃掉,加大了意图识别的难度,同时后续获取到信息减少,导致意图识别的结果的准确度降低。
技术实现思路
[0004]本申请实施例提供了一种多轮对话意图识别模型的训练方法、装置及设备,可以解决上述技术问题。
[0005]第一方面,本申请实施例提供了一种多轮对话意 ...
【技术保护点】
【技术特征摘要】
1.一种多轮对话意图识别模型的训练方法,其特征在于,所述方法包括:获取训练样本集;所述训练样本集包括多轮对话及其多轮对话中包括的样本文本对应的结果标签;对所述样本文本进行预处理,得到所述样本文本中包含的样本子句的第一子句信息;所述第一子句信息包括所述样本文本的上一轮样本文本、所述样本子句和所述样本子句的顺序编号;将所述样本子句的第一子句信息输入多轮对话意图识别模型进行识别处理,得到所述样本文本对应的样本识别结果;其中,所述多轮对话意图识别模型包括样本预训练语言模型、样本子句间语言模型、样本自回归模型和样本注意力机制模型;根据所述样本文本对应的样本识别结果、样本文本对应的结果标签和预设损失函数计算目标损失值;若所述目标损失值不满足预设中止条件,则根据所述目标损失值对所述多轮对话意图识别模型进行更新,并返回执行将所述样本子句的第一子句信息输入多轮对话意图识别模型进行识别处理;若所述目标损失值满足预设中止条件,则输出训练完成的多轮对话意图识别模型。2.如权利要求1所述的多轮对话意图识别模型的训练方法,其特征在于,所述将所述样本子句的第一子句信息输入多轮对话意图识别模型进行识别处理,得到所述样本文本对应的样本识别结果,包括:将所述样本子句的第一子句信息输入样本预训练语言模型进行处理,得到所述样本子句的第一特征信息和第一相关关系;所述第一相关关系表示所述样本子句与所述上一轮样本文本之间的关系;将所述样本子句的第一特征信息和第一相关关系输入样本子句间语言模型进行处理,得到所述样本文本的第二特征信息和第二相关关系;所述第二相关关系用于标识所述样本子句之间的关系;获取上轮样本对话状态信息,并将所述上轮样本对话状态信息、所述第二特征信息和所述第二相关关系输入样本自回归模型进行处理,得到本轮样本对话状态信息和所述样本文本的第三特征信息;将所述第一相关关系、所述第二相关关系和所述第三特征信息输入样本注意力机制模型进行处理,得到所述样本子句的第四特征信息;根据所述第三特征信息和所述第四特征信息确定所述样本文本对应的样本识别结果。3.如权利要求2所述的多轮对话意图识别模型的训练方法,其特征在于,所述样本识别结果包括总句意图和分句意图;所述根据所述第三特征信息和所述第四特征信息确定所述样本文本对应的样本识别结果,包括:根据预设总句任务处理策略对所述第三特征信息进行处理,得到所述样本文本的总句意图;根据预设分句任务处理策略对所述第四特征信息进行处理,得到所述样本文本的分句意图。4.如权利要求1所述的多轮对话意图识别模型的训练方法,其特征在于,所述对所述样
本文本进行预处理,得到所述样本文本中包含的样本子句的第一子句信息,包括:根据预设分句策略对所述样本文本进行分句处理得到所述样本文本中包含的样本子句,并获取所述样本子句的顺序编号;...
【专利技术属性】
技术研发人员:李滨君,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。