一种基于深度学习的视频人群情绪分析方法及系统技术方案

技术编号：29675603 阅读：15 留言：0更新日期：2021-08-13 21:57

本发明专利技术涉及一种情绪分析的技术领域，公开了一种基于深度学习的视频人群情绪分析方法，包括：获取待分析的视频流数据，利用高斯降噪方法对视频流中的每一帧图片进行降噪处理，并利用鬼影消除算法对视频帧图片进行鬼影消除处理；利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征；利用人脸检测算法检测视频帧图片的人脸，并对检测到的人脸进行裁剪，得到人脸图像；利用表情识别算法对人脸图像进行特征提取，提取到人脸表情特征；根据提取的人群姿态特征以及人脸表情特征，利用情绪识别模型对视频中人群进行情绪分析处理。本发明专利技术还提供了一种基于深度学习的视频人群情绪分析系统。本发明专利技术实现了视频中的人群情绪分析。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的视频人群情绪分析方法及系统
本专利技术涉及情绪识别的
，尤其涉及一种基于深度学习的视频人群情绪分析方法及系统。
技术介绍
随着这些年来大数据的爆发和计算能力的提升，人工智能是相对火热的一个研究方向，在计算机方面它是一个重要的领域。21世纪是属于计算机的，人们对计算机计算能力的要求也更加精细化，其逐渐变成人类生活里面必不可少的要素。随之而来的变化是人们对人机交互的迫切要求，如何利用人工智能技术实现视频中人群情绪的识别，成为当前研究领域的热门话题。在视频序列中，各个片段之间的表情强度存在很大差异，直接去测量每一帧的容错率是很难执行并产生令人满意的结果；同时大多数情绪识别方法比较重视识别表情峰值高的图像，而忽略了细微的低强度表情，从而具有一定的识别误差。鉴于此，如何提取视频序列中的不同情绪特征，并准确对人群情绪进行识别，成为本领域技术人员亟待解决的问题。
技术实现思路
本专利技术提供一种基于深度学习的视频人群情绪分析方法，通过利用尺度自适应的人群姿态获取算法提取人群的姿态特征，并利用人脸检测算法检测视频帧画面的人脸图像，利用表情识别算法提取人脸表情特征，从而根据人群姿态特征和人脸表情特征，分析视频中人群的情绪。为实现上述目的，本专利技术提供的一种基于深度学习的视频人群情绪分析方法，包括：获取待分析的视频流数据，利用高斯降噪方法对视频流中的每一帧图片进行降噪处理，并利用鬼影消除算法对视频帧图片进行鬼影消除处理；利用尺度自适应的人群姿态获取算法...

【技术保护点】
1.一种基于深度学习的视频人群情绪分析方法，其特征在于，所述方法包括：/n获取待分析的视频流数据，利用高斯降噪方法对视频流中的每一帧图片进行降噪处理，并利用鬼影消除算法对视频帧图片进行鬼影消除处理；/n利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征；/n利用人脸检测算法检测视频帧图片的人脸，并对检测到的人脸进行裁剪，得到人脸图像；/n利用表情识别算法对人脸图像进行特征提取，提取到人脸表情特征；/n根据提取的人群姿态特征以及人脸表情特征，利用情绪识别模型对视频中人群进行情绪分析处理。/n

【技术特征摘要】
1.一种基于深度学习的视频人群情绪分析方法，其特征在于，所述方法包括：
获取待分析的视频流数据，利用高斯降噪方法对视频流中的每一帧图片进行降噪处理，并利用鬼影消除算法对视频帧图片进行鬼影消除处理；
利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征；
利用人脸检测算法检测视频帧图片的人脸，并对检测到的人脸进行裁剪，得到人脸图像；
利用表情识别算法对人脸图像进行特征提取，提取到人脸表情特征；
根据提取的人群姿态特征以及人脸表情特征，利用情绪识别模型对视频中人群进行情绪分析处理。

2.如权利要求1所述的一种基于深度学习的视频人群情绪分析方法，其特征在于，所述利用鬼影消除算法对视频帧图片进行鬼影消除处理，包括：
1)选取视频中无运动物体的帧图片作为参考图片，参考图片的灰度级概率密度为pr(r)，非参考图片的灰度级概率密度为pz(z)，计算参考图片与非参考图片的映射关系为：

其中：
z表示参考图片像素；
r表示非参考图片像素；
H(·)表示直方图匹配操作；
对非参考图片中的每个像素进行直方图匹配处理，得到曝光调整后的视频帧图片；
2)计算参考图片和非参考图片之间的差分图像：
Dk＝|Ik-I|
其中：
Ik表示曝光调整后的第k张视频帧图片；
I表示参考图片；
Dk表示第k张非参考图片与参考图片之间的差分图像；
3)计算差分图像的信息熵：

其中：
i表示差分图像中像素i的灰度值；
j表示该像素的15×15像素邻域窗口的像素均值；
M×N像素表示差分图像的大小；
4)利用阈值识别差分图像像素：

其中：
Fk(x，y)表示消除鬼影权重图，当Fk(x，y)＝0时，该像素为动态像素，当Fk(x，y)＝1时，该像素为静态像素；
T为像素划分阈值，将其设置为2；
对于视频帧图片中的每个像素：
I′k(x，y)＝Ik(x，y)×Fk(x，y)
其中：
Ik(x，y)表示第k张非参考图片的像素(x，y)；
I′k(x，y)表示第k张非参考图片的鬼影消除后的像素(x，y)。

3.如权利要求2所述的一种基于深度学习的视频人群情绪分析方法，其特征在于，所述利用尺度自适应的人群姿态获取算法提取视频帧图片中的姿态特征，包括：
1)将连续的视频帧图片作为基于时序的LSTM模型输入，其中LSTM模型的输入为xi，t，i∈{1，2，...，K}，K表示骨骼关键点总数，t∈{1，2，...，T}表示时间帧；
2)利用前向传播算法进行LSTM参数更新：
ci，t＝xi，t⊙ci，t-1
hi，t＝tanh(ci，t)
其中：
ci，t表示t时刻的单元状态；
hi，t表示t时刻的单元隐藏层；
3)计算LSTM模型的初始全局上下文存储信息M0：

4)重复n次2)-3)，得到n次前向传播的存储信息Mn-1；计算每个hi，t的信息得分：

选取得分最高的H个单元隐藏层hi，t作为人群中的姿态特征；将H设置为100。

4.如权利要求3所述的一种基于深度学习的视频人群情绪分析方法，其特征在于，所述利用人脸检测算法检测视频帧图片的人脸，包括：
1)获取训练样本集S＝{(x1，y1)，(x2，y2)，...，(xN，yN)}，其中xi为图像数据，yi表示图像标签，yi＝-1表示当前图像不存在人脸，yi＝+1表示当前图像存在人脸；其中不存在人脸的样本数为m，存在人脸的样本数为n，N＝n+m；
2)初始化训练样本权重：
W1＝(w11，w12，...，w1N)

3)利用Adaboost算法对待权重的样本进行训练，得到若干弱分类器Oc(x)；计算弱分类器的分类误差率：
ec＝P(Oc(xi)≠yi)<...

【专利技术属性】
技术研发人员：汪知礼，
申请(专利权)人：汪知礼，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人