一种基于深度残差网络的宠物图像情绪识别方法技术

技术编号：27744068 阅读：19 留言：0更新日期：2021-03-19 13:38

本发明专利技术提供了一种基于深度残差网络的宠物图像情绪识别方法，该方法包括：获取不同情绪下单只宠物的音频和视频，并根据所述音频进行预处理及提取声音特征；根据所述声音特征对所述音频进行统计分类和情绪标记，并根据时序和所述视频提取对应的单帧图片，得到带有情绪标记的宠物图像情绪数据集；构建宠物情绪分类算法模型，并将所述宠物图像情绪数据集作为训练数据进行模型训练；通过训练后的模型对宠物进行目标检测和情绪推断。本发明专利技术能提高宠物情绪识别的确定性，提高识别的推断速度和精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度残差网络的宠物图像情绪识别方法
本专利技术涉及情绪识别
，尤其涉及一种基于深度残差网络的宠物图像情绪识别方法。
技术介绍
当前家庭宠物越来越多，人与宠物之间的交流也越来越多，然而人们常对宠物表达的情绪无法进行有效识别，造成交流障碍，引起宠物的不受控制，出现宠物咬伤路人的情况。而经验丰富的宠物主人可以通过宠物声音的音调、音量、频次等，准确地判断宠物的情绪，从而给出有效的安抚方式，而这种能力不是每个宠物主人都拥有的。现有基于音频数据的识别方法，主要通过倒谱系数共振峰和过零率作为特征参数，建立例如高斯混合模型等统计模型，或使用无监督聚类方法对宠物情绪进行分类。但该方法在使用过程中存在以下缺点：1、音频信号采集困难，干扰较大，不容易采集到信噪比较好的信号用于识别；2、对同时有多个宠物在场的情况无法支持；3、需要在时域上累积一段时间的数据才可以用于情绪识别，限制了现实中的使用；4、某些情况下宠物可能没有发出足够的声音用于识别。因而如何准确掌握宠物的情绪，以便更好的安抚和互动成为宠物主人想要解决的问题。
技术实现思路
本专利技术提供一种基于深度残差网络的宠物图像情绪识别方法，解决现基于音频数据的宠物情绪识别存在识别不准确的问题，能提高宠物情绪识别的确定性，提高识别的推断速度和精度。为实现以上目的，本专利技术提供以下技术方案：一种基于深度残差网络的宠物图像情绪识别方法，包括：获取不同情绪下单只宠物的音频和视频，并根据所述音频进行预处理及提取声音特征；根据...

【技术保护点】
1.一种基于深度残差网络的宠物图像情绪识别方法，其特征在于，包括：/n获取不同情绪下单只宠物的音频和视频，并根据所述音频进行预处理及提取声音特征；/n根据所述声音特征对所述音频进行统计分类和情绪标记，并根据时序和所述视频提取对应的单帧图片，得到带有情绪标记的宠物图像情绪数据集；/n构建宠物情绪分类算法模型，并将所述宠物图像情绪数据集作为训练数据进行模型训练；/n通过训练后的模型对宠物进行目标检测和情绪推断。/n

【技术特征摘要】
1.一种基于深度残差网络的宠物图像情绪识别方法，其特征在于，包括：
获取不同情绪下单只宠物的音频和视频，并根据所述音频进行预处理及提取声音特征；
根据所述声音特征对所述音频进行统计分类和情绪标记，并根据时序和所述视频提取对应的单帧图片，得到带有情绪标记的宠物图像情绪数据集；
构建宠物情绪分类算法模型，并将所述宠物图像情绪数据集作为训练数据进行模型训练；
通过训练后的模型对宠物进行目标检测和情绪推断。

2.根据权利要求1所述的基于深度残差网络的宠物图像情绪识别方法，其特征在于，构建宠物情绪分类算法模型包括：
构建二级网络，前级网络用于对图片内的宠物进行目标检测，获取检测的位置框，并根据所述位置框对单帧图片进行切图和增强处理；
后级网络用于对裁剪出的图片进行情绪识别，以得到推断结果。

3.根据权利要求2所述的基于深度残差网络的宠物图像情绪识别方法，其特征在于，所述前级网络为宠物目标检测网络，使用改进的yolov4网络结构，主力网络使用增加注意力机制的mobilenetv3进行特征提取，以进行宠物分类和区域切图。

4.根据权利要求3所述的基于深度残差网络的宠物图像情绪识别方法，其特征在于，所述后级网络为深度残差网络，在ResNet网络中加入注意力模块，以单张已分类宠物图片作为输入进行快速识别宠物情绪。

5.根据权利要求4所述的基于深度残差网络的宠物图像情绪识别方法，其特征在于，所述根据所述音频进行预处理及提取声音特征，包括：
采用经验模态分解的方式去除短时非平稳信号的高频噪声，以克服傅里叶变换在有限时长和非平稳信号上不准确；
采用HHT变换获得声音信号的边际谱，并获取边际谱能量；
使用短时边际谱能量和短时平均过零率作为门限，检测语音端点，切分语音片段。

6.根据权利要求5所述的基于深度残差网络的宠物图像情绪识别方法，其特征在于，所述根据所述音频进行预处理及提取声音特征，还包括：
对切分好的语音片段进行削波处理，计算峰值所在的位置并在边际谱...

【专利技术属性】
技术研发人员：郭祥，谢衍涛，宋娜，王鼎，陈继，梅启鹏，
申请(专利权)人：杭州格像科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人