【技术实现步骤摘要】
一种语音情感识别方法、装置、设备及其存储介质
[0001]本申请涉及数字医疗
,应用于智慧问诊及远程会诊场景中,尤其涉及一种语音情感识别方法、装置、设备及其存储介质。
技术介绍
[0002]客服是服务行业一种稳定、可靠的服务方式,随着数字医疗领域的发展,特别是智慧问诊客服。通过与患者交流的方式提供业务服务,能让患者体验到服务的温暖,更容易得到患者的信任。在与他人进行交流时,如果可以获取到患者当前的情感状态,再根据这些的情感状态进行对应的交流话术,更有利于拉近和患者的距离,得到患者的信任。通常,人的情感状态的主要变现在面部表情、声音、肢体动作等,但最主要的还是表现在声音上。
[0003]目前,已经存在不少基于机器学习的语音情感识别方法,在语音情感识别领域应用最广泛的深度学习算法有卷积神经网络,长短时记忆网络等。但这些深度学习网络在进行训练时由于网络模型参数的复杂度及过程不可控等原因,导致最终的情感状态分类不准确,难以应用于环境复杂的客服领域。因此,现有技术在进行语音情感识别上,还缺少一种普适性和自学习能力强的语音
【技术保护点】
【技术特征摘要】
1.一种语音情感识别方法,其特征在于,包括下述步骤:获取预先设置的情感分类标签;从预设的已标注分类标签的MFCC特征训练集内,分别获取不同情感分类标签所对应的MFCC特征,将所述MFCC特征按照情感分类标签的不同加入到不同的MFCC特征集内,获得集合添加结果;将MFCC特征训练集内所有MFCC特征一并输入预构建的情感检测模型,进行模型训练,根据训练结果和所述集合添加结果,获取训练完成的情感检测模型,其中,所述预构建的情感检测模型都为由BP神经网络架构而成的分类预测模型;实时获取对患者进行服务过程中产生的患者语音信息;采用MATLAB对所述患者语音信息进行特征提取,获取所述患者语音信息对应的MFCC特征;将所述MFCC特征输入训练完成的情感检测模型,获得情感检测结果;将所述情感检测结果反馈给目标客服。2.根据权利要求1所述的语音情感识别方法,其特征在于,所述情感分类标签包括高兴、生气、悲伤、害怕和惊讶,所述分别获取不同情感分类标签所对应的MFCC特征,将所述MFCC特征按照情感分类标签的不同加入到不同的MFCC特征集内,获得集合添加结果的步骤,具体包括:从预设的已标注分类标签的MFCC特征训练集内,分别获取表示高兴、生气、悲伤、害怕和惊讶的MFCC特征;并以所述高兴、生气、悲伤、害怕和惊讶为集合区别名称,构建区别集合;将所述高兴、生气、悲伤、害怕和惊讶分别对应的MFCC特征加入到相应的区别集合内,即获得集合添加结果。3.根据权利要求1所述的语音情感识别方法,其特征在于,在执行所述将MFCC特征训练集内所有MFCC特征一并输入预构建的情感检测模型,进行模型训练,根据训练结果和所述集合添加结果,获取训练完成的情感检测模型的步骤之前,所述方法还包括:部署预先设置的初始权值和初始偏置值至所述预构建的情感检测模型;所述将MFCC特征训练集内所有MFCC特征一并输入预构建的情感检测模型,进行模型训练,根据训练结果和所述集合添加结果,获取训练完成的情感检测模型的步骤,具体包括:步骤A,采用改进的蝙蝠优化算法,对所述预构建的情感检测模型进行初始权值和初始偏置值优化,获得优化之后的最优情感检测模型;步骤B,基于所述最优情感检测模型对所述所有MFCC特征进行情感检测分类,得到分类结果;步骤C,通过所述分类结果、所述集合添加结果和所述情感检测模型的损失函数,计算所述最优情感检测模型的损失度;步骤D,判断所述损失度是否超过预设的损失度阈值;步骤E,若超过,则采用误差反向传播法优化调整所述最优情感检测模型的权值和偏置值,重复执行步骤B至步骤D;步骤F,若不超过,则将所述最优情感检测模型作为训练完成的情感检测模型。4.根据权利要求3所述的语音情感识别方法,其特征在于,所述采用改进的蝙蝠优化算
法,对所述预构建的情感检测模型进行初始权值和初始偏置值优化,获得优化之后的最优情感检测模型的步骤,具体包括:步骤a,获取预先引入的动态惯性因子,并根据所述动态惯性因子对蝙蝠优化算法进行改进,获得改进后的蝙蝠优化算法;步骤b,将所述初始权值和初始偏置值作为蝙蝠个体的起始位置信息;步骤c,根据所述改进后的蝙蝠优化算法和所述蝙蝠个体的起始位置信息,进行迭代更新,计算所述蝙蝠个体的当前位置信息;步骤d,每次迭代更新后,获取所述蝙蝠个体的当前位置信息对应的权值和偏置值,并部署给所述预构建的情感检测模型,进行分类验证,获得分类验证结果;步骤e,根据所述分类验证结果,筛选出以往迭代更新中的最优权值和最优偏置值,重新设为蝙蝠个体的起始位置信息,重复执行步骤c、d、e;步骤f,直到满足迭代终止条件,筛选出以往迭代更新中的最优权值和最优偏置值设置给所述预构建的情感检测模型,获得所述最优情感检测模型,其中,所述迭代终止条件包括:最优权值和最优偏置值不再发生变化,或者达到预设的最大迭代次数。5.根据权利要求4所述的语音情感识别方法,其特征在于,所述获取预先引入的动态惯性因子,并根据所述动态惯性因子对蝙蝠优化算法进行改进,获得改进后的蝙蝠优化算法的步骤,具体包括:根据预设的第一公式:V
i
(t+1)=σ
t
...
【专利技术属性】
技术研发人员:刘兴廷,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。