一种利用宠物语音信号识别情绪的方法及系统技术方案

技术编号:39061159 阅读:16 留言:0更新日期:2023-10-12 19:54
本发明专利技术提供一种利用宠物语音信号识别情绪的方法及系统,包括:获取宠物的语音信号,对语音信号进行预处理,获得可用语音信号;对可用语音信号进行多特征提取,获得多种特征图;对多种特征图进行拼接,获得融合特征图;将融合特征图分别输入AlexNet网络、MobileNetV2网络和ResNet34网络,获得第一识别结果、第二识别结果和第三识别结果;对第一识别结果、第二识别结果和第三识别结果进行融合处理,获得最终识别结果。本发明专利技术通过多种网络对同一个特征图进行分析,每个网络提取不同维度的特征,同时使用熵权法对每个网络的识别结果进行融合,得到最终识别结果,很大程度上缓解了梯度消失和梯度爆炸等问题,同时还具有很高的情绪识别准确率。准确率。准确率。

【技术实现步骤摘要】
一种利用宠物语音信号识别情绪的方法及系统


[0001]本专利技术涉及声信号识别领域,尤其涉及一种利用宠物语音信号识别情绪的方法及系统。

技术介绍

[0002]家养物种被认为是研究种间关系和交流的合适对象,因为驯化、人工选择和与人类的密切共存塑造了它们的行为和社会认知能力,有利于相互理解、有效沟通和情感联系。动物一般是通过动作、姿态、声音等行为来表达情绪,因此,在相关技术中,通常需要一些经验丰富的人员根据动物的特定行为来识别动物的情绪。然而人工经验有限,且人们对动物情绪的认知局限于长期的经验总结和直觉判断,因此如何实时有效地感知动物情绪成为了一种较为新颖的研究方向,现有的基于声信号的宠物情绪识别方法主要包含宠物位姿识别和基于机器学习的诊断方法,这里的宠物包括比如宠物狗和宠物猫,也涵盖其它家养宠物或动物。
[0003]基于宠物位姿情绪识别的方法属于计算机视觉技术,对宠物的姿态和表情进行分析,从而判断宠物的情绪和状态。该方法通过对宠物的图像或视频进行分析,来判断宠物的情绪状态,如高兴、生气、害怕等。该方法的缺点是情绪场景不充分,导致预测不准确。
[0004]基于机器学习的声信号方法就是利用计算机对大量的数据进行分析研究,寻找数据内部的分布规律,从而建立数学模型并利用该模型对未知数据进行预测,缺点是准确率不是很高。
[0005]基于深度学习的情绪识别方法需要对采集到的声信号进行时频特征提取,再使用神经网络对特征进行学习及分类,该技术虽然原理简单,但由于提取多模态特征,会使计算成本增加。
[0006]总体而言,现有的针对宠物情绪判别的方法,存在检测成本高、稳定性差、实时性低等缺点。

技术实现思路

[0007]为解决上述技术问题,本专利技术提供一种利用宠物语音信号识别情绪的方法,包括步骤:
[0008]S1:获取宠物的语音信号,对语音信号进行预处理,获得可用语音信号;
[0009]S2:对可用语音信号进行多特征提取,获得多种特征图;对多种特征图进行拼接,获得融合特征图;
[0010]S3:构建情绪识别模型,情绪识别模型包括:AlexNet网络、MobileNetV2网络和ResNet34网络;
[0011]S4:将融合特征图分别输入AlexNet网络、MobileNetV2网络和ResNet34网络,获得第一识别结果、第二识别结果和第三识别结果;
[0012]S5:对第一识别结果、第二识别结果和第三识别结果进行融合处理,获得最终识别
结果。
[0013]优选的,步骤S1具体为:
[0014]S11:获取语音信号的音频,在音频上设置语音窗口;设置检测窗口,通过检测窗口在语音窗口内滑动进行分帧处理,获得多帧语音信号,计算每一帧语音信号的短时能量;
[0015]S12:若各帧语音信号的短时能量的总和与语音窗口的能量比值大于阈值,则判断语音窗口内的语音信号为可用语音信号;否则判断为不可用语音信号;
[0016]S13:重复步骤S11

S13,将音频上的不可用语音信号剔除,获得音频上的可用语音信号。
[0017]优选的,步骤S2具体为:
[0018]S21:对可用语音信号分别进行语谱、logmel频谱、MFCC、色度、音调网络、光谱对比度特征提取,获得语谱特征图、logmel频谱特征图、MFCC特征图、色度特征图、音调网络特征图和光谱对比度特征图;
[0019]S22:将语谱特征图作为主特征,其它特征图作为辅助特征,依次将语谱特征图、logmel频谱特征图、MFCC特征图、色度特征图、音调网络特征图和光谱对比度特征图进行顺序拼接,获得融合特征图。
[0020]优选的:
[0021]AlexNet网络包括依次连接的第一卷积网络、第一Full Connect模块、第一Dropout模块和第二Full Connect模块。
[0022]优选的:
[0023]MobileNetV2网络包括依次连接的第二卷积网络、第三Full Connect模块、第二Dropout模块和第四Full Connect模块。
[0024]优选的:
[0025]ResNet34网络包括依次连接的第三卷积网络、第五Full Connect模块、第三Dropout模块和第六Full Connect模块。
[0026]优选的,步骤S5具体为:
[0027]S51:获取第一识别结果、第二识别结果和第三识别结果的Softmax函数的输出概率p
ij
,其中i表示识别结果的编号,j表示第i个识别结果的第j个数据;
[0028]S52:计算获得第i个识别结果的第j个数据的信息熵E
ij
,计算公式为:
[0029][0030]其中,n为识别结果的总数,n≤3;
[0031]S53:计算获得第i个识别结果的总信息熵E
i
,计算公式为:
[0032][0033]其中,J为第i个识别结果的数据总数;
[0034]S54:计算获得第i个识别结果的权重,计算公式为:
[0035][0036]S55:计算获得最终识别结果S,计算公式为:
[0037]S=W1×
Softmax1+W2×
Softmax2+W3×
Softmax3
[0038]其中,Softmax1为第一识别结果的Softmax函数值,Softmax2为第二识别结果的Softmax函数值,Softmax3为第三识别结果的Softmax函数值。
[0039]一种利用宠物语音信号识别情绪的系统,包括模块:
[0040]语音预处理模块,用于获取宠物的语音信号,对语音信号进行预处理,获得可用语音信号;
[0041]特征图融合模块,用于对可用语音信号进行多特征提取,获得多种特征图;对多种特征图进行拼接,获得融合特征图;
[0042]情绪识别模型构建模块,用于构建情绪识别模型,情绪识别模型包括:AlexNet网络、MobileNetV2网络和ResNet34网络;
[0043]情绪识别模块,用于将融合特征图分别输入AlexNet网络、MobileNetV2网络和ResNet34网络,获得第一识别结果、第二识别结果和第三识别结果;
[0044]识别结果融合模块,用于对第一识别结果、第二识别结果和第三识别结果进行融合处理,获得最终识别结果。
[0045]本专利技术具有以下有益效果:
[0046]通过计算语音信号的能量对语音信号进行预处理,剔除语音中的空白段,留下可用语音信号,以此节约计算成本和时间;通过多特征提取可以从不同的角度进行特征提取,对同一段音频进行多维度分析和拼接,获得最好的融合特征图;通过多种网络对同一个特征图进行分析,每个网络提取不同维度的特征,同时使用熵权法对每个网络的识别结果进行融合,得到最终识别结果,很大程度上缓解了梯度消失和梯度爆炸等问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用宠物语音信号识别情绪的方法,其特征在于,包括步骤:S1:获取宠物的语音信号,对语音信号进行预处理,获得可用语音信号;S2:对可用语音信号进行多特征提取,获得多种特征图;对多种特征图进行拼接,获得融合特征图;S3:构建情绪识别模型,情绪识别模型包括:AlexNet网络、MobileNetV2网络和ResNet34网络;S4:将融合特征图分别输入AlexNet网络、MobileNetV2网络和ResNet34网络,获得第一识别结果、第二识别结果和第三识别结果;S5:对第一识别结果、第二识别结果和第三识别结果进行融合处理,获得最终识别结果。2.根据权利要求1所述的利用宠物语音信号识别情绪的方法,其特征在于,步骤S1具体为:S11:获取语音信号的音频,在音频上设置语音窗口;设置检测窗口,通过检测窗口在语音窗口内滑动进行分帧处理,获得多帧语音信号,计算每一帧语音信号的短时能量;S12:若各帧语音信号的短时能量的总和与语音窗口的能量比值大于阈值,则判断语音窗口内的语音信号为可用语音信号;否则判断为不可用语音信号;S13:重复步骤S11

S13,将音频上的不可用语音信号剔除,获得音频上的可用语音信号。3.根据权利要求1所述的利用宠物语音信号识别情绪的方法,其特征在于,步骤S2具体为:S21:对可用语音信号分别进行语谱、logmel频谱、MFCC、色度、音调网络、光谱对比度特征提取,获得语谱特征图、logmel频谱特征图、MFCC特征图、色度特征图、音调网络特征图和光谱对比度特征图;S22:将语谱特征图作为主特征,其它特征图作为辅助特征,依次将语谱特征图、logmel频谱特征图、MFCC特征图、色度特征图、音调网络特征图和光谱对比度特征图进行顺序拼接,获得融合特征图。4.根据权利要求1所述的利用宠物语音信号识别情绪的方法,其特征在于:AlexNet网络包括依次连接的第一卷积网络、第一Full Connect模块、第一Dropout模块和第二FullConnect模块。5.根据权利要求1所述的利用宠物语音信号识别情绪的方法,其特征在于:MobileNetV2网络包括依次连接的第二卷积网络、...

【专利技术属性】
技术研发人员:余永升曾强祝锐袁小红
申请(专利权)人:海纳科德湖北科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1