【技术实现步骤摘要】
对话意图识别模型训练方法、装置、计算机设备及介质
本专利技术涉及语义解析
,尤其涉及一种对话意图识别模型训练方法、装置、计算机设备及介质。
技术介绍
随着科学技术的发展,自然语言处理
也快速发展,例如自然语言处理
可以应用于智能多轮对话系统、文本相似度判定系统等系统中。其中,智能多轮对话系统需要根据客户的对话内容识别其意图,该意图用于后续的流程控制以及对话生成,因此意图识别是智能多轮对话中的关键技术。现有技术中,意图识别常常会采用意图识别模型进行意图提取,对于意图识别模型的训练需要采用带有标签的数据,而现有的带有标签的数据需要从历史对话信息中筛选得到后,通过人为标注的方法进行标签标注,但是,通过该方式得到的已标注标签的数据量往往不够充足,进而导致意图识别模型无法得到完整充分的训练,从而使得意图识别模型的准确率较低。
技术实现思路
本专利技术实施例提供一种对话意图识别模型训练方法、装置、计算机设备及介质,以解决由于已标注标签的数据量不充足,导致意图识别模型的准确率较低的问题。一种对话意图识别模型训练方法,包括:获取预设对话样本数据集;所述对话样本数据集中包含至少一个不具有对话意图标签的第一对话样本数据;将所述第一对话样本数据输入至基于ES检索构建的检索模型中,确定与所述第一对话样本数据对应的增强样本数据集;所述增强样本数据集中包括至少一个增强样本数据;将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中,对所述 ...
【技术保护点】
1.一种对话意图识别模型训练方法,其特征在于,包括:/n获取预设对话样本数据集;所述对话样本数据集中包含至少一个不具有对话意图标签的第一对话样本数据;/n将所述第一对话样本数据输入至基于ES检索构建的检索模型中,确定与所述第一对话样本数据对应的增强样本数据集;所述增强样本数据集中包括至少一个增强样本数据;/n将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中,对所述第一对话样本数据以及所述增强样本数据进行增强意图识别,得到与所述第一对话样本数据对应的第一样本分布,以及与所述增强样本数据对应的第二样本分布;/n根据所述第一样本分布以及所述第二样本分布确定分布损失值,并根据各所述分布损失值确定所述初始意图识别模型的总损失值;/n在所述总损失值未达到预设的收敛条件时,更新迭代所述初始意图识别模型的第一初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始意图识别模型记录为对话意图识别模型。/n
【技术特征摘要】
1.一种对话意图识别模型训练方法,其特征在于,包括:
获取预设对话样本数据集;所述对话样本数据集中包含至少一个不具有对话意图标签的第一对话样本数据;
将所述第一对话样本数据输入至基于ES检索构建的检索模型中,确定与所述第一对话样本数据对应的增强样本数据集;所述增强样本数据集中包括至少一个增强样本数据;
将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中,对所述第一对话样本数据以及所述增强样本数据进行增强意图识别,得到与所述第一对话样本数据对应的第一样本分布,以及与所述增强样本数据对应的第二样本分布;
根据所述第一样本分布以及所述第二样本分布确定分布损失值,并根据各所述分布损失值确定所述初始意图识别模型的总损失值;
在所述总损失值未达到预设的收敛条件时,更新迭代所述初始意图识别模型的第一初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始意图识别模型记录为对话意图识别模型。
2.如权利要求1所述的对话意图识别模型训练方法,其特征在于,所述对话样本数据集中还包含至少一个具有所述对话意图标签的第二对话样本数据;所述将所述第一对话样本数据以及所述增强样本数据输入至包含第一初始参数的初始意图识别模型中之前,包括:
将所述第二对话样本数据输入至包含第二初始参数的预设识别模型中,通过所述预设识别模型对所述第二对话样本数据进行标注意图识别,得到与所述第二对话样本数据对应的各标注预测标签;一个所述标注预测标签关联一个标签预测概率;
根据各所述标注预测标签、与各所述标注预测标签对应的标签预测概率以及所述对话意图标签,确定所述预设识别模型的预测损失值;
在所述预测损失值未达到预设的收敛条件时,更新迭代所述预设识别模型的第二初始参数,直至所述预测损失值达到所述预设的收敛条件时,将收敛之后的所述预设识别模型记录为所述初始意图识别模型。
3.如权利要求2所述的对话意图识别模型训练方法,其特征在于,所述根据各所述标注预测标签、与各所述标注预测标签对应的标签预测概率以及所述对话意图标签,确定所述预设识别模型的预测损失值,包括:
根据各所述标注预测标签与所述对话意图标签,确定与各所述标注预测标签对应的标注预测结果;
根据各所述标注预测结果以及与各所述标注预测结果对应的所述标签预测概率,通过交叉熵损失函数确定所述预设识别模型的预测损失值。
4.如权利要求1所述的对话意图识别模型训练方法,其特征在于,将所述第一对话样本数据输入至基于ES检索构建的检索模型中,确定与所述第一对话样本数据相似的增强样本数据集,包括:
将所述第一对话样本数据输入至所述检索模型中,对所述第一对话样本数据进行向量编码处理,得到与所述第一对话样本数据对应的对话编码向量;
自所述检索模型的检索数据库中获取所有检索对话向量,并确定所述对话编码向量与各所述检索对话向量之间的向量编辑距离;一个所述检索对话向量关联一个检索样本句子;
将各所述向量编辑距离与预设距离阈值进行比较,并将小于或等于预设距离阈值的向量编辑距离关联的检索句子,记录为待选取样本数据;
根据所有所述待选取样本数据构建所述增强样本数据集。
5.如权利要求4所述的对话意图识别模型训练方法,其特征在于,所述根据所有所述待选取样本数据构建...
【专利技术属性】
技术研发人员:王健宗,宋青原,吴天博,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。