当前位置: 首页 > 专利查询>汪知礼专利>正文

一种基于深度学习的视频人群情绪分析方法及系统技术方案

技术编号:29675603 阅读:15 留言:0更新日期:2021-08-13 21:57
本发明专利技术涉及一种情绪分析的技术领域,公开了一种基于深度学习的视频人群情绪分析方法,包括:获取待分析的视频流数据,利用高斯降噪方法对视频流中的每一帧图片进行降噪处理,并利用鬼影消除算法对视频帧图片进行鬼影消除处理;利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征;利用人脸检测算法检测视频帧图片的人脸,并对检测到的人脸进行裁剪,得到人脸图像;利用表情识别算法对人脸图像进行特征提取,提取到人脸表情特征;根据提取的人群姿态特征以及人脸表情特征,利用情绪识别模型对视频中人群进行情绪分析处理。本发明专利技术还提供了一种基于深度学习的视频人群情绪分析系统。本发明专利技术实现了视频中的人群情绪分析。

【技术实现步骤摘要】
一种基于深度学习的视频人群情绪分析方法及系统
本专利技术涉及情绪识别的
,尤其涉及一种基于深度学习的视频人群情绪分析方法及系统。
技术介绍
随着这些年来大数据的爆发和计算能力的提升,人工智能是相对火热的一个研究方向,在计算机方面它是一个重要的领域。21世纪是属于计算机的,人们对计算机计算能力的要求也更加精细化,其逐渐变成人类生活里面必不可少的要素。随之而来的变化是人们对人机交互的迫切要求,如何利用人工智能技术实现视频中人群情绪的识别,成为当前研究领域的热门话题。在视频序列中,各个片段之间的表情强度存在很大差异,直接去测量每一帧的容错率是很难执行并产生令人满意的结果;同时大多数情绪识别方法比较重视识别表情峰值高的图像,而忽略了细微的低强度表情,从而具有一定的识别误差。鉴于此,如何提取视频序列中的不同情绪特征,并准确对人群情绪进行识别,成为本领域技术人员亟待解决的问题。
技术实现思路
本专利技术提供一种基于深度学习的视频人群情绪分析方法,通过利用尺度自适应的人群姿态获取算法提取人群的姿态特征,并利用人脸检测算法检测视频帧画面的人脸图像,利用表情识别算法提取人脸表情特征,从而根据人群姿态特征和人脸表情特征,分析视频中人群的情绪。为实现上述目的,本专利技术提供的一种基于深度学习的视频人群情绪分析方法,包括:获取待分析的视频流数据,利用高斯降噪方法对视频流中的每一帧图片进行降噪处理,并利用鬼影消除算法对视频帧图片进行鬼影消除处理;利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征;利用人脸检测算法检测视频帧图片的人脸,并对检测到的人脸进行裁剪,得到人脸图像;利用表情识别算法对人脸图像进行特征提取,提取到人脸表情特征;根据提取的人群姿态特征以及人脸表情特征,利用情绪识别模型对视频中人群进行情绪分析处理。可选地,所述利用鬼影消除算法对视频帧图片进行鬼影消除处理,包括:1)选取视频中无运动物体的帧图片作为参考图片,参考图片的灰度级概率密度为pr(r),非参考图片的灰度级概率密度为pz(z),计算参考图片与非参考图片的映射关系为:其中:z表示参考图片像素;r表示非参考图片像素;H(·)表示直方图匹配操作;对非参考图片中的每个像素进行直方图匹配处理,得到曝光调整后的视频帧图片,使得非参考图片和参考图片具有相似的曝光度;2)计算参考图片和非参考图片之间的差分图像:Dk=|Ik-I|其中:Ik表示曝光调整后的第k张视频帧图片;I表示参考图片;Dk表示第k张非参考图片与参考图片之间的差分图像;3)计算差分图像的信息熵:其中:i表示差分图像中像素i的灰度值;j表示该像素的15×15像素邻域窗口的像素均值;M×N像素表示差分图像的大小;4)利用阈值识别差分图像像素:其中:Fk(x,y)表示消除鬼影权重图,当Fk(x,y)=0时,该像素为动态像素,当Fk(x,y)=1时,该像素为静态像素;T为像素划分阈值,将其设置为2;对于视频帧图片中的每个像素:I′k(x,y)=Ik(x,y)×Fk(x,y)其中:Ik(x,y)表示第k张非参考图片的像素(x,y);I′k(x,y)表示第k张非参考图片的鬼影消除后的像素(x,y)。可选地,所述利用尺度自适应的人群姿态获取算法提取视频帧图片中的姿态特征,包括:1)将连续的视频帧图片作为基于时序的LSTM模型输入,其中LSTM模型的输入为xi,t,i∈{1,2,...,K},K表示骨骼关键点总数,t∈{1,2,...,T}表示时间帧;2)利用前向传播算法进行LSTM参数更新:ci,t=xi,t⊙ci,t-1hi,t=tanh(ci,t)其中:ci,t表示t时刻的单元状态;hi,t表示t时刻的单元隐藏层;3)计算LSTM模型的初始全局上下文存储信息M0:4)重复n次2)-3),得到n次前向传播的存储信息Mn-1;计算每个hi,t的信息得分:选取得分最高的H个单元隐藏层hi,t作为人群中的姿态特征;将H设置为100。可选地,所述利用人脸检测算法检测视频帧图片的人脸,包括:1)获取训练样本集S={(x1,y1),(x2,y2),...,(xN,yN)},其中xi为图像数据,yi表示图像标签,yi=-1表示当前图像不存在人脸,yi=+1表示当前图像存在人脸;其中不存在人脸的样本数为m,存在人脸的样本数为n,N=n+m;2)初始化训练样本权重:W1=(w11,w12,...,w1N)3)利用Adaboost算法对待权重的样本进行训练,得到若干弱分类器Oc(x);计算弱分类器的分类误差率:ec=P(Oc(xi)≠yi)并计算弱分类器Oc(x)的权重:4)将弱分类器通过线性组合方式进行组合,生成一个强分类器O(x):其中:K表示生成的弱分类器数量,将其设置为20;5)将待检测视频帧图片输入到强分类器O(x)中,若O(x)值为1,则说明待检测视频帧图片为存在人脸,则对检测到的人脸进行裁剪,得到人脸图像,在本专利技术一个具体实施例中,本专利技术将人脸图像的大小调整为50*50像素大小。可选地,所述利用表情识别算法对人脸图像进行特征提取,包括:网络上支路输入第一帧中的人脸图像,作为模板输入;网络下支路输入后续帧的人脸图像,作为待检测输入;两个输入分别通过权值共享的全卷积神经网络操作做特征映射;使用3×3像素大小的卷积核对模板输入进行卷积处理,并将卷积通道数调整为k倍,得到尺度为3×3×k像素大小的模板特征使用3×3像素大小的卷积核对待检测输入进行卷积处理,得到尺度为3×3×1像素大小的待检测特征τ(x);将模板特征在卷积通道上按序等分为k份,将其看作是k个大小为3×3×1的卷积核;将k个卷积核与待检测特征τ(x)进行卷积处理,生成卷积通道数为k的特征图,并将生成特征图作为人脸表情特征。可选地,所述利用情绪识别模型对视频中人群进行情绪分析处理,包括:1)将人群姿态特征和人脸表情特征拼接为情绪特征F:F={(x1,y1,t1),(x2,y2,t2),...}其中:xi表示在ti时刻的人群姿态特征;yi表示在ti时刻的人脸表情特征;2)利用情绪识别模型提取训练的情绪识别特征;3)将情绪特征F输入到情绪识别模型中:其中:N表示情绪识别模型中卷积层的数量;Wi表示第i层卷积层的权重;bi表示第i层卷积层的偏置向量;y表示情绪识别特征,将情绪识别特征与预提取到的训练情绪识别特征进行特征匹本文档来自技高网...

【技术保护点】
1.一种基于深度学习的视频人群情绪分析方法,其特征在于,所述方法包括:/n获取待分析的视频流数据,利用高斯降噪方法对视频流中的每一帧图片进行降噪处理,并利用鬼影消除算法对视频帧图片进行鬼影消除处理;/n利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征;/n利用人脸检测算法检测视频帧图片的人脸,并对检测到的人脸进行裁剪,得到人脸图像;/n利用表情识别算法对人脸图像进行特征提取,提取到人脸表情特征;/n根据提取的人群姿态特征以及人脸表情特征,利用情绪识别模型对视频中人群进行情绪分析处理。/n

【技术特征摘要】
1.一种基于深度学习的视频人群情绪分析方法,其特征在于,所述方法包括:
获取待分析的视频流数据,利用高斯降噪方法对视频流中的每一帧图片进行降噪处理,并利用鬼影消除算法对视频帧图片进行鬼影消除处理;
利用尺度自适应的人群姿态获取算法提取视频帧图片中人群的姿态特征;
利用人脸检测算法检测视频帧图片的人脸,并对检测到的人脸进行裁剪,得到人脸图像;
利用表情识别算法对人脸图像进行特征提取,提取到人脸表情特征;
根据提取的人群姿态特征以及人脸表情特征,利用情绪识别模型对视频中人群进行情绪分析处理。


2.如权利要求1所述的一种基于深度学习的视频人群情绪分析方法,其特征在于,所述利用鬼影消除算法对视频帧图片进行鬼影消除处理,包括:
1)选取视频中无运动物体的帧图片作为参考图片,参考图片的灰度级概率密度为pr(r),非参考图片的灰度级概率密度为pz(z),计算参考图片与非参考图片的映射关系为:



其中:
z表示参考图片像素;
r表示非参考图片像素;
H(·)表示直方图匹配操作;
对非参考图片中的每个像素进行直方图匹配处理,得到曝光调整后的视频帧图片;
2)计算参考图片和非参考图片之间的差分图像:
Dk=|Ik-I|
其中:
Ik表示曝光调整后的第k张视频帧图片;
I表示参考图片;
Dk表示第k张非参考图片与参考图片之间的差分图像;
3)计算差分图像的信息熵:



其中:
i表示差分图像中像素i的灰度值;
j表示该像素的15×15像素邻域窗口的像素均值;
M×N像素表示差分图像的大小;
4)利用阈值识别差分图像像素:



其中:
Fk(x,y)表示消除鬼影权重图,当Fk(x,y)=0时,该像素为动态像素,当Fk(x,y)=1时,该像素为静态像素;
T为像素划分阈值,将其设置为2;
对于视频帧图片中的每个像素:
I′k(x,y)=Ik(x,y)×Fk(x,y)
其中:
Ik(x,y)表示第k张非参考图片的像素(x,y);
I′k(x,y)表示第k张非参考图片的鬼影消除后的像素(x,y)。


3.如权利要求2所述的一种基于深度学习的视频人群情绪分析方法,其特征在于,所述利用尺度自适应的人群姿态获取算法提取视频帧图片中的姿态特征,包括:
1)将连续的视频帧图片作为基于时序的LSTM模型输入,其中LSTM模型的输入为xi,t,i∈{1,2,...,K},K表示骨骼关键点总数,t∈{1,2,...,T}表示时间帧;
2)利用前向传播算法进行LSTM参数更新:
ci,t=xi,t⊙ci,t-1
hi,t=tanh(ci,t)
其中:
ci,t表示t时刻的单元状态;
hi,t表示t时刻的单元隐藏层;
3)计算LSTM模型的初始全局上下文存储信息M0:



4)重复n次2)-3),得到n次前向传播的存储信息Mn-1;计算每个hi,t的信息得分:






选取得分最高的H个单元隐藏层hi,t作为人群中的姿态特征;将H设置为100。


4.如权利要求3所述的一种基于深度学习的视频人群情绪分析方法,其特征在于,所述利用人脸检测算法检测视频帧图片的人脸,包括:
1)获取训练样本集S={(x1,y1),(x2,y2),...,(xN,yN)},其中xi为图像数据,yi表示图像标签,yi=-1表示当前图像不存在人脸,yi=+1表示当前图像存在人脸;其中不存在人脸的样本数为m,存在人脸的样本数为n,N=n+m;
2)初始化训练样本权重:
W1=(w11,w12,...,w1N)



3)利用Adaboost算法对待权重的样本进行训练,得到若干弱分类器Oc(x);计算弱分类器的分类误差率:
ec=P(Oc(xi)≠yi)<...

【专利技术属性】
技术研发人员:汪知礼
申请(专利权)人:汪知礼
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1