一种自然场景下人脸表情数据集的构建方法技术

技术编号:20364178 阅读:225 留言:0更新日期:2019-02-16 17:06
本发明专利技术公开了一种自然场景下人脸表情数据集的构建方法,包括对所有的图像进行裁剪,并灰度化为120×120的灰度图像;使用软件MATLAB中的GUI设计界面,对每组灰度图像继续标注,标注项目为人脸部件的状态标签和表情标签;并进行Kappa一致性检验,进而生成mat标签文件并存储该mat标签文件;并对建立的人脸表情数据库进行测试,且与Cohn‑Kanade表情数据库和JAFFE人脸表情数据库对比。本发明专利技术能准确地给出人脸表情的眉、眼、嘴和人脸角度的详细状态,以及表情。FELW数据库图像众多,表情分类丰富,为训练深度卷积神经网络提供了可靠的数据支撑,可用于人脸表情识别系统。

【技术实现步骤摘要】
一种自然场景下人脸表情数据集的构建方法
本专利技术涉及人脸表情识别
,具体指的是一种自然场景下人脸表情数据集的构建方法。
技术介绍
人脸表情识别技术是涉及生物特征识别、图像处理、运动跟踪、机器视觉、模式识别、生理学、心理学等研究领域的一个富有挑战性的交叉课题,是多年以来模式识别与人工智能领域研究的一个热点问题。目前在人脸表情识别研究中使用最广泛的是CMU的Cohn-Kanade数据库,在很多研究中被列为算法比较的标准。Cohn-Kanade数据库是基于AU编码的数据库,含有210个对象的大约2000个图像序列,每个人有一系列的脸部活动,包括单个AU或者AU组合。其次,日本ATR的女性表情数据库(JAFFE)也得到较多使用。JAFFE是以7种基本表情为基础的数据库,包括10位日本女性,每种表情有大约3、4幅图像,总共213幅图像。此外还有一些可以应用于人脸表情识别的数据库,如Lucey等人在2010改进的CK+表情数据集,Yale人脸数据库和CMU的PIE数据库等。这些数据库都是在特定条件下采集的图像或图像序列,目标对象和表情分类都很单一,并且图像数量比较少。目前很多的人脸表情识别系统的报告成果都是在特定的数据库上实验进行的。随着人脸表情识别的研究深入,出现了具有较好泛化能力的人脸识别算法,对于多个人脸表情数据库都能适应,迫切需要一个自然场景下,图像数量大,表情分类更丰富(十种表情)且随机性较高的人脸数据库。深度卷积神经网络是目前图像识别领域的前沿技术,在人脸表情识别上具有广泛的应用,具有较好的识别效果。其本质上是一种特征学习算法,采用监督学习策略,从表情数据库中提取表情特征,进而实现人脸表情分类。通常也用来测试人脸表情数据库的优越性,通过对不同的表情数据集进行相同的测试,然后对比测试结果,同时结合Fisher线性判别,两步分类和特征选择线性规划法等经典方法的结果进行横向对比。
技术实现思路
本专利技术为了解决现有技术的上述不足,提出了一种自然场景下人脸表情数据集的构建方法。以提供图像数量众多的,且能准确地给出人脸表情的眉,眼,嘴,人脸角度的详细状态和表情的数据库,并使用该方法建立一个自然场景下的人脸表情数据集(theFacialExpressionDatasetsinthewild,FELW),为人脸表情识别技术中训练深度卷积神经网络提供数据支持。为了解决上述技术问题,本专利技术采用以下技术方案:(1)在互联网上批量下载自然场景下的人脸图像,对所有的图像进行裁剪,并灰度化为120×120的灰度图像;(2)使用软件MATLAB中的GUI设计界面,将上述灰度图像分为4个组,对每组灰度图像继续标注,标注项目为人脸部件的状态标签(Part_Label)和表情标签(Emotion_Label);(3)对标注完成的同一组的灰度图像的标签数据进行融合,并进行Kappa一致性检验,进而生成mat标签文件并存储该mat标签文件;(4)给生成的mat标签文件建立人脸表情数据库(FELW),并对建立的人脸表情数据库进行测试,且与Cohn-Kanade表情数据库和JAFFE人脸表情数据库对比。进一步地,在步骤(1)中的互联网上批量下载的人脸图像的图像收集方案包括为通过互联网收集不同年龄、种族、性别的人脸表情图像,并使用自动人脸检测程序,裁剪得到人脸图像。进一步地,在步骤(2)中所述的人脸部件的状态标签包含了人脸的角度、眉、眼、嘴4大类,共计16个状态的状态标签项目;所述的表情标签包含10类表情和置信度,表情分别为平(中性)、喜(高兴)、怒(生气)、哀(悲伤)、惊(惊讶)、恐(恐惧)、恶(厌恶)、羞(害羞)、傲(傲慢)、鄙视。进一步地,在步骤(3)中进行的Kappa一致性检验的方法包括用Kappa系数来检验两种检验结果是否一致,对3组EmotionLabel两两进行Kappa一致性检验。Kappa检验的公式为其中,pe是每一类正确分类的样本数量之和除以总样本数,也就是总体分类精度。与现有技术相比,本专利技术的有益效果如下:1.能准确地给出训练深度卷积神经网络所需要的人脸状态标签和表情标签。本专利技术提出的人脸表情图像数据库的构建方法,针对图像并不全是正脸,添加各个角度方位的状态标签;然后对人脸部件的状态标签和表情标签进行标注;为了保证标签信息的准确性,每组图像都是由3位志愿者进行单独标注,然后进行Kappa一致性检验,融合为标签信息。2.能提供图像数量众多的,人脸表情分类丰富的数据库,为训练良好性能的人脸表情识别算法提供数据支持。深度卷积神经网络的特征提取能力不仅仅取决于网络架构,还依赖于所使用的数据库。现有的人脸表情数据库都是在特定条件下采集的图像或图像序列,目标对象和表情分类都很单一,并且图像数量比较少,很难检验深度卷积神经网络的真实优越性和适应性。本专利技术提出的人脸表情图像数据库的构建方法,原始图像的来源都是互联网,数据集的图像数量众多,表情分类丰富。为训练良好性能的人脸表情识别算法提供数据支持。附图说明图1为本专利技术的实现流程图;图2为本专利技术的裁剪后的灰度图像样本图;图3为本专利技术的标注界面;图4为本专利技术的人脸部分的状态示例图。具体实施方式下面结合附图和实施例对专利技术进行详细的说明。如图1所示,本专利技术提出的自然场景下人脸表情数据集的构建方法,步骤一:在互联网上批量下载自然场景下的人脸图像,裁剪,灰度化为120x120的灰度图像本实例以从互联网任意收集到的自然场景下的人脸图像为例,对图像进行人脸检测,裁剪,灰度化。收集的原始图像为任意自然场景下的人脸图像。本实例中,批量从互联网收集了300K张自然场景下的人脸图像。然后采用自动人脸检测程序,获得26848张人脸图像。为保证图片规格的一致性,对得到的人脸图像进行自动裁剪,灰度化成120x120的灰度图。灰度图样本如图2所示。步骤二:用MATLAB中的GUI设计界面,对灰度图进行状态和表情标注将灰度图分为4个组,每组由3个人标注。挑选12位志愿者(一年级到四年的本科生各为3人)对26848张灰度图像进行主观评测,标注人脸部件的状态标签(Part_Label)和表情标签(Emotion_Label)。其中,在用MATLAB中的GUI设计界面中,标注界面如图3所示。状态标签(Part_Label)包括人脸的角度、眉、眼、嘴四个子类。其中人脸的角度有5个状态,眉的标签具有4个状态,眼的标签具有3个状态,嘴的标签具有4种状态。表情标签(Emotion_Label)包含10个状态,分别是平(中性)、喜(高兴)、怒(生气)、哀(悲伤)、惊(惊讶)、恐(恐惧)、恶(厌恶)、羞(害羞)、傲(傲慢)、鄙视。由于图像并不全是正脸,首先添加人脸的角度标签。人脸的角度标签状态有,正脸、左侧脸、右侧脸、仰视、俯视。对眉毛的标签,设定4个状态,分别为弯眉、皱眉、眉毛上竖和平直。对眼睛标签设置3个状态,分别为睁眼、闭眼、瞪眼。对嘴巴标签设置了4个状态,分别为嘴角上扬(通过观察嘴巴是否上扬辅助判断)、嘴角下垂(通过观察嘴部形成的弧线是否朝下进行辅助判断)、张嘴(通过观察嘴巴是否张开或形成一个O形进行辅助判断)、咬牙(在能看到牙齿的情况下,观察待标注图像中的对象是否咬牙切齿)。Emotion_Label是一组1x10的向本文档来自技高网
...

【技术保护点】
1.一种自然场景下人脸表情数据集的构建方法,其特征在于包括以下步骤:(1)在互联网上批量下载自然场景下的人脸图像,对所有的图像进行裁剪,并灰度化为120×120的灰度图像;(2)使用软件MATLAB中的GUI设计界面,将上述灰度图像分为4个组,对每组灰度图像继续标注,标注项目为人脸部件的状态标签和表情标签;(3)对标注完成的同一组的灰度图像的标签数据进行融合,并进行Kappa一致性检验,进而生成mat标签文件并存储该mat标签文件;(4)给生成的mat标签文件建立人脸表情数据库,并对建立的人脸表情数据库进行测试,且与Cohn‑Kanade表情数据库和JAFFE人脸表情数据库对比。

【技术特征摘要】
1.一种自然场景下人脸表情数据集的构建方法,其特征在于包括以下步骤:(1)在互联网上批量下载自然场景下的人脸图像,对所有的图像进行裁剪,并灰度化为120×120的灰度图像;(2)使用软件MATLAB中的GUI设计界面,将上述灰度图像分为4个组,对每组灰度图像继续标注,标注项目为人脸部件的状态标签和表情标签;(3)对标注完成的同一组的灰度图像的标签数据进行融合,并进行Kappa一致性检验,进而生成mat标签文件并存储该mat标签文件;(4)给生成的mat标签文件建立人脸表情数据库,并对建立的人脸表情数据库进行测试,且与Cohn-Kanade表情数据库和JAFFE人脸表情数据库对比。2.根据权利要求1所述的自然场景下人脸表情数据集的构建方法,其特征在于:在步骤(1)中的互联网上批量下载的人脸图像的图像收集方案包括为通过互联网收集不...

【专利技术属性】
技术研发人员:叶继华刘燕甘荧薛声军王明文李汉曦王仕民
申请(专利权)人:江西师范大学
类型:发明
国别省市:江西,36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1