当前位置: 首页 > 专利查询>之江实验室专利>正文

一种模型训练和业务执行的方法、装置、介质及设备制造方法及图纸

技术编号:35926604 阅读:20 留言:0更新日期:2022-12-10 11:20
本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。该模型训练的方法包括:获取用户在历史上的语音对话数据并输入待训练的识别模型,通过识别模型的特征提取层,确定语音对话数据对应的数据特征,以及确定所述语音对话数据对应的情感强度,作为预测情感强度,和语音对话数据对应的情感类别,作为预测情感类别,根据预测情感强度和语音对话数据对应的实际情感强度之间的偏差,以及预测情感类别和语音对话数据对应的实际情感类别之间的偏差,确定识别模型的综合损失值,以最小化该综合损失值为优化目标,对识别模型进行训练。练。练。

【技术实现步骤摘要】
一种模型训练和业务执行的方法、装置、介质及设备


[0001]本说明书涉及计算机
,尤其涉及一种模型训练和业务执行的方法、装置、介质及设备。

技术介绍

[0002]随着科技的发展,人机交互技术也在诸如智能客服、智能对话机器人等领域得到了广泛的应用,对于用户输入的语音数据,交互系统通常会通过相应的模型算法,来对语音数据所表达的情感(如愤怒、恐惧、悲伤以及厌恶等)进行识别,进而根据识别到的情感执行与之相匹配的交互动作。
[0003]然而,目前在对用户输入的语音进行情感识别的过程中,通常只会识别出语音数据的情感类型,识别到的结果较为单一,并不能完全表达出用户当前的情绪,这就会导致后续执行的交互动作效果较差,严重影响了用户体验。
[0004]因此,如何根据识别模型的识别结果准确的执行相应的业务,提高用户体验,是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型训练和业务执行的方法、装置、介质及设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:本说明书提供了一种模型训练的方法,包括:获取用户在历史上执行客服业务的语音对话数据;将所述语音对话数据输入待训练的识别模型,通过所述识别模型的特征提取层,确定所述语音对话数据对应的数据特征;将所述数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的情感强度,作为预测情感强度,以及,将所述数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的情感类别,作为预测情感类别;根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的综合损失值;以最小化所述综合损失值为优化目标,对所述识别模型进行训练。
[0007]可选地,将所述语音对话数据输入待训练的识别模型,具体包括:针对所述语音对话数据中的每一帧数据,确定该帧数据是否为静音数据;将所述语音对话数据首尾两端的静音数据进行删除处理,得到处理后语音对话数据;将所述处理后语音对话数据输入所述识别模型。
[0008]可选地,将所述处理后语音对话数据输入所述识别模型,具体包括:
判断所述处理后语音对话数据对应的时间长度是否大于预设时间长度;若是,则对所述处理后语音对话数据进行裁剪,得到裁剪后语音对话数据;将所述裁剪后语音对话数据输入所述识别模型。
[0009]可选地,根据所述数据特征,将所述数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的情感强度,作为预测情感强度,以及,将所述数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的情感类别,作为预测情感类别,具体包括:根据所述数据特征以及所述语音对话数据对应的时间长度,确定所述语音对话数据对应的平均数据特征;将所述平均数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的所述预测情感强度,以及,将所述平均数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的所述预测情感类别。
[0010]可选地,根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的综合损失值,具体包括:根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,确定所述识别模型的第一损失值,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的第二损失值;根据所述第一损失值、第一损失值对应的预设权重以及所述第二损失值,确定所述综合损失值。
[0011]可选地,以最小化所述综合损失值为优化目标,对所述识别模型进行训练,具体包括:根据预设的初始学习率、学习率衰减指数、衰减周期以及训练次数,确定每次对所述识别模型进行训练时,所述识别模型对应的学习率,其中,所述训练次数越多,所述学习率越小;根据每次对所述识别模型进行训练时,所述识别模型对应的学习率,以最小化所述综合损失值为优化目标,对所述识别模型进行训练。
[0012]本说明书提供了一种业务执行的方法,包括:获取用户的语音数据;将所述语音数据输入预先训练的识别模型,通过所述识别模型的特征提取层,确定所述语音数据对应的语音特征,以及,将所述语音特征输入到所述识别模型的第一分类层,以确定所述语音数据对应的情感强度,以及,将所述语音特征输入到所述识别模型的第二分类层,以确定所述语音数据对应的情感类别,其中,所述识别模型是通过上述模型训练的方法训练得到的;根据所述语音数据对应的情感类别以及所述情感强度,确定业务的执行策略,并根据所述执行策略执行所述业务。
[0013]本说明书提供了一种模型训练的装置,包括:获取模块,获取用户在历史上执行客服业务的语音对话数据;输入模块,将所述语音对话数据输入待训练的识别模型,通过所述识别模型的特
征提取层,确定所述语音对话数据对应的数据特征;第一确定模块,将所述数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的情感强度,作为预测情感强度,以及,将所述数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的情感类别,作为预测情感类别;第二确定模块,根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的综合损失值;训练模块,以最小化所述综合损失值为优化目标,对所述识别模型进行训练。
[0014]本说明书提供了一种业务执行的装置,包括:获取模块,获取用户的语音数据;确定模块,将所述语音数据输入预先训练的识别模型,通过所述识别模型的特征提取层,确定所述语音数据对应的语音特征,以及,将所述语音特征输入到所述识别模型的第一分类层,以确定所述语音数据对应的情感强度,以及,将所述语音特征输入到所述识别模型的第二分类层,以确定所述语音数据对应的情感类别,其中,所述识别模型是通过上述模型训练的方法训练得到的;执行模块,根据所述语音数据对应的情感类别以及所述情感强度,确定业务的执行策略,并根据所述执行策略执行所述业务。
[0015]本说明书采用的上述至少一个技术方案能够达到以下有益效果:在本说明书提供的模型训练的方法中,本说明书公开了一种模型训练和业务执行的方法、装置、介质及设备。该模型训练的方法包括:获取用户在历史上执行客服业务的语音对话数据并输入待训练的识别模型,通过识别模型的特征提取层,确定语音对话数据对应的数据特征,以及确定所述语音对话数据对应的情感强度,作为预测情感强度,和语音对话数据对应的情感类别,作为预测情感类别,根据预测情感强度和语音对话数据对应的实际情感强度之间的偏差,以及预测情感类别和语音对话数据对应的实际情感类别之间的偏差,确定识别模型的综合损失值,以最小化该综合损失值为优化目标,对识别模型进行训练。
[0016]从上述方法可以看出,本方案在识别模型的训练过程中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取用户在历史上执行客服业务的语音对话数据;将所述语音对话数据输入待训练的识别模型,通过所述识别模型的特征提取层,确定所述语音对话数据对应的数据特征;将所述数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的情感强度,作为预测情感强度,以及,将所述数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的情感类别,作为预测情感类别;根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的综合损失值;以最小化所述综合损失值为优化目标,对所述识别模型进行训练。2.如权利要求1所述的方法,其特征在于,将所述语音对话数据输入待训练的识别模型,具体包括:针对所述语音对话数据中的每一帧数据,确定该帧数据是否为静音数据;将所述语音对话数据首尾两端的静音数据进行删除处理,得到处理后语音对话数据;将所述处理后语音对话数据输入所述识别模型。3.权利要求2所述的方法,其特征在于,将所述处理后语音对话数据输入所述识别模型,具体包括:判断所述处理后语音对话数据对应的时间长度是否大于预设时间长度;若是,则对所述处理后语音对话数据进行裁剪,得到裁剪后语音对话数据;将所述裁剪后语音对话数据输入所述识别模型。4.如权利要求1所述的方法,其特征在于,根据所述数据特征,将所述数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的情感强度,作为预测情感强度,以及,将所述数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的情感类别,作为预测情感类别,具体包括:根据所述数据特征以及所述语音对话数据对应的时间长度,确定所述语音对话数据对应的平均数据特征;将所述平均数据特征输入到所述识别模型的第一分类层,以确定所述语音对话数据对应的所述预测情感强度,以及,将所述平均数据特征输入到所述识别模型的第二分类层,以确定所述语音对话数据对应的所述预测情感类别。5.如权利要求1所述的方法,其特征在于,根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,以及所述预测情感类别和所述语音对话数据对应的实际情感类别之间的偏差,确定所述识别模型的综合损失值,具体包括:根据所述预测情感强度和所述语音对话数据对应的实际情感强度之间的偏差,确定所述识别模型的第一损失值,以及所述预测情感类别和...

【专利技术属性】
技术研发人员:李太豪岳鹏程屈乐园郑书凯
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1