基于双流卷积神经网络的新生儿疼痛表情识别方法技术

技术编号：24854914 阅读：39 留言：0更新日期：2020-07-10 19:08

本发明专利技术公开了一种基于双流卷积神经网络的新生儿疼痛表情识别方法，该方法首先将视频进行分帧处理，接着在多个连续的帧之间添加光流位移场获得对应的光流信息以得到光流图。然后构造出一个共用Attention双流卷积神经网络，该网络是在双流卷积神经网络的基础上添加了共用Attention模块，该网络主要由两个预训练的VGG16网络和共用Attention模块组成。在该网络中，首先从各帧图像序列中选择表情变化最大的一帧作为其中一路VGG16网络的输入，我们将该路网络称为空间信息网络，然后将光流图作为另一路VGG16网络的输入，我们称该路网络为时间信息网络。最后将通过两路网络后的特征图进行级联并输入全连接层进行新生儿疼痛表情分类。

全部详细技术资料下载

【技术实现步骤摘要】
基于双流卷积神经网络的新生儿疼痛表情识别方法
本专利技术涉及一种基于双流卷积神经网络的新生儿疼痛表情识别方法，属于深度学习与模式识别方向。
技术介绍
面部表情识别一直是一个活跃的研究领域，面部表情识别对于机器学习方法来说却不是一个容易的问题。人类的认知能力较强，一般可以通过一个人的面部表情和肢体动作得到这个人的情绪状况，进而可以根据这个人的情绪采取相应的行动措施。但是机器想要识别出人的情感，就十分困难，随着科技的发展，机器的拟人化成为研究的热点。2014年，KarenSimonyan和AndrewZisserman提出双流卷积神经网络，使用两路相同的卷积神经网络对视频中的行为进行识别，同时考虑了视频中的空间位置信息及时间位置信息，取得了不少成果。虽然卷积神经网络可以将传统情感识别的过程简单化，但它只是对视频中的每一个静止帧进行了特征提取，只考虑到了视频的空间信息，而忽略了视频的时间信息，这使得情感识别具有很多的局限性。相比于单个卷积神经网络的情感识别，通过双流卷积神经网络进行的情感识别取得了更好的识别效果。本专利技术正是利用了两路独立网络之间的联系，时间与空间信息必定存在关联特征，运用两者之间的共通性、互联性，提取更有效的深度情感特征，得到更好的情感识别效果。
技术实现思路
专利技术目的：本专利技术目的在于弥补现有双流卷积神经网络情感识别技术在识别人类情感方面所存在的不足。在双流卷积神经网络的基础上添加了共用Attention模块，使两路独立卷积神经网络之间建立联系，将时间信息与空间信息结...

【技术保护点】
1.一种基于双流卷积神经网络的新生儿疼痛表情识别方法，其特征在于,包括以下步骤：/n(1)获取新生儿疼痛表情数据库，并按照10:1的比例将其分为训练集和测试集；/n(2)分帧处理数据库中的视频得到帧图片，从中选取各视频帧中表情变化最大的一帧，并在多个连续的帧之间添加光流位移场得到对应的光流图；/n(3)构建一个共用Attention双流卷积神经网络模型，该模型包含两个预训练的VGG16网络和共用Attention模块；/n(4)将训练集中选取的帧图片与光流图分别作为两路网络的输入，优化网络模型参数，得到训练好的网络模型；/n(5)测试集的视频帧和光流图送至优化后的共用Attention双流卷积神经网络进行情感识别，得到情感识别结果。/n

【技术特征摘要】
1.一种基于双流卷积神经网络的新生儿疼痛表情识别方法，其特征在于,包括以下步骤：
(1)获取新生儿疼痛表情数据库，并按照10:1的比例将其分为训练集和测试集；
(2)分帧处理数据库中的视频得到帧图片，从中选取各视频帧中表情变化最大的一帧，并在多个连续的帧之间添加光流位移场得到对应的光流图；
(3)构建一个共用Attention双流卷积神经网络模型，该模型包含两个预训练的VGG16网络和共用Attention模块；
(4)将训练集中选取的帧图片与光流图分别作为两路网络的输入，优化网络模型参数，得到训练好的网络模型；
(5)测试集的视频帧和光流图送至优化后的共用Attention双流卷积神经网络进行情感识别，得到情感识别结果。

2.根据权利要求1所述的一种基于共用Attention双流卷积神经网络的新生儿疼痛表情识别方法，其特征在于，步骤(2)中视频分帧与光流图生成的过程包括：
(2.1)从视频中截取帧，输入视频，输出视频中的每一帧图片；
(2.2)生成光流图，输入视频的连续多帧图片，输出各相邻帧间的光流图。

3.根据权利要求1所述的一种基于共用Attention双流卷积神经网络的新生儿疼痛表情识别方法，其特征在于，步骤(3)中共用Attention双流卷积神经网络模型包括的VGG16网络由13个卷积层、3个全连接层以及5个池化层组成，其中13个卷积层和5个池化层被分为五个卷积层组，每个卷积层组所包含卷积层的个数分别为2、2、3、3、3，分别用CONV1、CONV2、CONV3、CONV4和CONV5来表示这五个卷积层组。卷积层的计算公式表示为：

其中，A是深度，B是滤波器的大小，wd,m,n表示滤波器的第d层第m行第n列权重，xd,i,j表示图像的第d层第i行第j列像素，wb表示滤波器的偏置项，ai,j表示特征图的第i行第j列元素，f表示激活函数。进行卷积操作后的特征图
C*＝(C-D+2P)/S+1(公式2)
其中C为卷积操作前的矩阵宽和高，D为卷积核的宽和高，P为需要填充的0的个数，S为步长。
池化层具有两种操作方式，一种是最大值池化，另一种是均值池化。最常用的是最大值池化，且进行池化的滤波器大小E一般为2×2。若输入的数据尺寸为M×M×F，则输出的...

【专利技术属性】
技术研发人员：吕方惠，闫静杰，李海波，朱康，宋宇康，卢官明，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人