【技术实现步骤摘要】
一种基于改进的VGG-16网络模型的表情识别方法及装置
本专利技术涉及图像识别
,特别是涉及一种基于改进的VGG-16网络模型的表情识别方法及装置。
技术介绍
随着多媒体技术以及计算机的计算处理能力的发展,人们对于人机交互的需求越来越强烈,大量的研究着眼于实现面部表情分析的自动化。相关技术中,可以对人脸图像进行特征提取,进而使用预先训练得到的识别模型对提取的特征进行识别,得到面部图像的表情识别结果。其中,识别模型可以利用包括样本人脸图像的训练数据以及训练数据对应的表情标签进行训练得到。但是,表情识别的训练数据往往规模过小,容易导致识别结果过拟合,造成识别结果不够准确的问题。
技术实现思路
本专利技术实施例的目的在于提供一种基于改进的VGG-16网络模型的表情识别方法及装置,以实现提高表情识别准确度的效果。具体技术方案如下:第一方面,本专利技术实施例提供一种基于改进的VGG-16网络模型的表情识别方法,所述方法包括:获取面部图像;利用预先训练得到的改进的VGG- ...
【技术保护点】
1.一种基于改进的VGG-16网络模型的表情识别方法,其特征在于,所述方法包括:/n获取面部图像;/n利用预先训练得到的改进的VGG-16网络模型,对所述面部图像进行识别,得到所述面部图像反映的表情类型;/n其中,所述改进的VGG-16网络模型为利用经过预处理的多个样本图像,以及每个样本面部图像的表情标签训练得到的模型;所述预处理至少包括:对每个样本面部图像进行图像旋转,并将旋转后的图像与旋转前的图像均作为样本面部图像;所述改进的VGG-16网络模型,包括:7个卷积层,2个全连接层,批量归一化层以及Dropout层。/n
【技术特征摘要】
1.一种基于改进的VGG-16网络模型的表情识别方法,其特征在于,所述方法包括:
获取面部图像;
利用预先训练得到的改进的VGG-16网络模型,对所述面部图像进行识别,得到所述面部图像反映的表情类型;
其中,所述改进的VGG-16网络模型为利用经过预处理的多个样本图像,以及每个样本面部图像的表情标签训练得到的模型;所述预处理至少包括:对每个样本面部图像进行图像旋转,并将旋转后的图像与旋转前的图像均作为样本面部图像;所述改进的VGG-16网络模型,包括:7个卷积层,2个全连接层,批量归一化层以及Dropout层。
2.根据权利要求1所述的方法,其特征在于,任一卷积层,包括:
3×3的滤波器,以使得所述7个卷积层中的3×3的滤波器,堆叠进行5×5以及7×7的滤波器的卷积;
卷积层的特征图数目为:第一个卷积层和第二个卷积层为32,第三个卷积层和第四个卷积层为64,第五个卷积层、第六个卷积层以及第七个卷积层为128。
3.根据权利要求1或2所述的方法,其特征在于,所述改进的VGG-16网络模型,还包括三个池化层,其中,第三个池化层连接在第七个卷积层之后;所述全连接层的配置,包括:
在所述第三个池化层之后连接第一个全连接层,在所述第一个全连接层之后连接第四个批量归一化层,在所述第四个批量归一化层之后连接第二个全连接层,在所述第一个全连接层以及所述第二个全连接层之后,分别连接第一个Dropout层以及第二个Dropout层,且两个全连接层的维度分别为1024与512;
在第五个卷积层之后,第六个卷积层之后,以及所述第七个卷积层之后,分别连接第一个批量归一化层,第二个批量归一化层以及第三个批量归一化层;
在所述第二个全连接层之后连接第五个批量归一化层。
4.根据权利要求1所述的方法,其特征在于,所述将旋转后的图像与旋转前的图像均作为样本面部图像,包括:
分别将所述旋转后的图像与所述旋转前的图像输入归一化公式,得到样本面部图像:
其中,所述归一化公式为:
所述G′(x,y)表示归一化后的(x,y)处的像素值,所述G(x,y)表示输入归一化公式的图像G的(x,y)处的像素值,MaxG、MinG分别为所述图像G的像素最大值与像素最小值。
5.根据权利要求1所述的方法,其特征在于,所述预处理还包括:
当所述样本面部图像为三通道的图像时,将所述样本面部图像转换为单通道的灰度图像;
对所述灰度图像进行人脸检测,并移除与面部无关的背景。
6.根据权利要求1所述的方法,其特征在于,所述对每个样本面部图...
【专利技术属性】
技术研发人员:景晓军,陈千千,穆俊生,张杨英,魏思杰,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。