一种面向低质量视频图像的人物身份识别方法与装置制造方法及图纸

技术编号:19009453 阅读:18 留言:0更新日期:2018-09-22 09:17
本发明专利技术涉及一种面向低质量视频图像的人物身份识别方法与装置。本发明专利技术包括将视频图像经过摄像头采样、量化、重计算以后转换为数字图像并输入、存储到帧存储器中;对数字图像进行基于几何和统计特征的图像分类,获取目标图像;平移并截取目标图像的矩形区域;对于任意一幅给定的目标图像的矩形区域,进行搜索以确定其中是否含有人脸,如果含有人脸则提取脸部的特征信息包括位置、大小和姿态信息;根据提取脸部的特征信息,判断是否为特定身份用户,并发出身份识别结果。本发明专利技术集中解决在较低分辨率的视频图像中难以快速识别较模糊人脸的问题,可以大大降低计算量,识别率得到较大的提高,适用于嵌入式开发板等计算能力不足的装置。

Character recognition method and device for low quality video images

The invention relates to a character identification method and device for low quality video images. The present invention includes converting video image into digital image after sampling, quantizing and recalculating by camera, inputting and storing it into frame memory, classifying digital image based on geometric and statistical features, acquiring target image, translating and intercepting rectangular region of target image, and for any given image. The rectangular region of the target image is searched to determine whether the face is included. If the face is included, the feature information of the face is extracted, including position, size and pose information. The invention concentrates on solving the problem that it is difficult to identify blurred faces quickly in low resolution video images, can greatly reduce the amount of calculation, and has a higher recognition rate, and is suitable for devices with insufficient computing power such as embedded development boards.

【技术实现步骤摘要】
一种面向低质量视频图像的人物身份识别方法与装置
本专利技术属于图像身份识别领域,具体涉及一种面向低质量视频图像的人物身份识别方法与装置。
技术介绍
基于视频图像识别目标人物的身份,是安全监控、行迹追踪、自动开门、自助取款支付等很多场景下的基础性技术。人脸识别技术是视频图像身份识别技术的主要实现手段,人类的面部包含了足够多信息用于身份识别,每个人脸都具有其独一无二的特征,即便是双胞胎也不会具有完全一样的面容。除了面部包含足够的信息因此可靠性和准确度较好以外,相比较指纹识别和虹膜识别等其他身份识别技术,人脸识别只需要照相机和摄像头等常规设备,不需要其传感器作为采集特征的设备,成本低廉,方便部署,而且不需要人体接触就可以进行身份识别,人脸识别(FaceRecognition)研究起步于上个世纪,Galton陈述了通过人脸作为特征进行身份识别的可能,但是当时还没有涉及到自动人脸识别的问题。随后的人脸识别发展迅速,可以将这个过程划分为四个阶段:第一阶段(1964年~1990年)在这一阶段,研究者们并没有把人脸识别作为一个单独的课题来研究,而只是把人脸识别当作一般的模式识别问题看待,此时的人脸识别研究和其他的物体识别一样,都是基于图形几何结构特征的。研究集中于对面部剪影曲线的结构特征提取和分析,该方法思路需要精确测量特征点之间的几何距离,使用最近邻法和其他方法来识别人脸。这个阶段的人脸识别方法并不智能,许多工作都是人工进行的,是非自动识别的方法。第二阶段(1991年~1997年)这个阶段人脸识别技术得到了飞速发展,取得了许多重要成果,美国麻省理工学院媒体实验室的Turk和Pentland提出了“特征脸”,特征脸是一种基于K-L变换的无监督的人脸识别方法,采用主成分分析技术,把目标图像投影到特征脸子空间,有效的降低了维度,并通过它的投影点在子空间的位置以及投影线的长度来进行判定和识别。特征脸方法的缺点对于光照的变化不具有鲁棒性,尽管如此,特征脸的降维思想为之后的人脸识别方法带来了很大的启发,新提出的方法都或多或少的受到特征脸方法的影响。于此同期的另一个重要研究发现是MIT的Brunelli和Poggio通过对比基于几何结构特征(也就是第一阶段主要研究内容)与基于模板匹配方法进行人脸识别的结果,得到了一个结论:基于模板匹配的方法要优于基于几何结构特征的方法。这一导向性的结论与特征脸实验结果的共同作用,导致了单纯基于及格结构特征的人脸识别方法研究的终止,随后基于统计模式识别和基于表现的低维空间建模逐渐成为主流研究方向。Belhumeur等提出FisherFaces方法,在EigenFaces的PCA降维后基础上采用线性判别分析(LinearDiscriminantAnalysis,LDA)的方法,对得到的主成分进一步分析,寻找尽量大的类间散度和尽量小的类内散度,因此能够有效的提取出不同样本的差异之处。此后一段时间基于FisherFace的变种方法也得到了研究发展,如零空间法、子空间判别模型、增强判别模型等。还有许多优秀的方法提出,如弹性图匹配技术(ElasticGraphMatching,EGM)不但对人类的全局特征建模,还保留了面部局部关键位置的信息。柔性模型(FlexibleModels)的提出为早期人脸校准技术的发展提供铺垫。第三阶段(1998年~2011年)第三阶段是人脸识别发展如火如荼的阶段,针对上个阶段研究中普遍出现的对光照鲁棒性不良好的缺点,Georghiades等提出了基于光照锥的模型有效的排除了光照、姿态变化对人脸识别结果的影响。除了寻找对人面部表情、角度、光照、模糊等具有鲁棒性的特征外,越来越多的机器学习方法如支持向量机、K近邻分类、Bayes分类器等应用到人脸识别中来。2001年Viola和Jones提出了使用简单特征和层叠分类器的人脸检测框架,具有极高的检测效率,为人脸识提供了准确可靠的人脸图像区域。第四阶段(2012年~至今)人工神经网络(ArtificialNeuralNetwork,ANN)的概念早在上个世纪就已经提出,但是当时存在一些难以解决的问题。1986年Hinton等人提出了反向传播算法,把纠错的运算量下降到只和神经元数目本身成正比,同时也解决了人工神经网络不能处理异或门的问题,为后来的深度学习打下基础。1989年YannLecun使用第一个成功的卷积神经网络LeNet-5在英文手写体识别取得了重要研究成果。2006年Hinton在Science上提出了深度学习的概念,即深层次的卷积神经网络,这种方法模拟了人脑学习的过程,通过低层特征组合,学习到目标高层次的特征,而且这个学习的过程是无需人工干预的自动学习过程。2012年,Hinton、Alex等在ImageNet比赛中使用了深度卷积神经网络AlexNet,采用了ReLU激活函数解决了梯度消失的问题,以遥遥领先传统机器学习佼佼者SVM的成绩获取ImageNet冠军,深度学习在图像分类中的成功使人们意识到人脸识别也可以由深度学习解决,很大程度上刺激了深度学习在人脸识别中应用的发展,开启了深度学习的时代。随后各个大学、公司、研究机构都研究出了自己的深度卷积神经网络结构应用到人脸识别中,FaceBook的DeepFace、香港中文大学的DeepID、Google的FaceNet等传统结构的CNN相继推出。GoogleNet、何凯明的残差网络、SURehman提出的无监督CNN、EMRudd提出的混合目标优化网络也不断改进优化着深度神经网络的结构。深度学习的识别率超越了人眼的识别率97.53%,并不断地创造新的纪录。除了基于深度学习的方法外,基于人脸3d模型的方法,联合不同表示的人脸识别方法也都取得了不错的效果。尽管经历了长期的研究,但目前在视频中进行人脸识别仍然需要开发更高的鲁棒性和更高计算效率的方法和设备。目前可以基于拍摄面部图像进行人物身份识别的技术一般都要求面部图像的图像质量比较好,这样才能够从面部图像中提取出几何结构、“特征脸”、图像纹理等标志人物身份的特征信息。但是,在某些情况下,比如拍摄的环境光线情况不好、聚焦不好、有干扰信号等,导致面部图像模糊或者存在较多的噪声,就无法准确提取标志人物身份的特征信息了。因此,如何能在图像模糊,图像存在较多的噪声等情况下实现人物身份的识别成为了目前本领域亟待解决的问题。
技术实现思路
本专利技术的目的在于提供一种面向低质量视频图像的人物身份识别方法。本专利技术的目的还在于提供一种面向低质量视频图像的人物身份识别装置。本专利技术的目的是在噪声、光照不足、失焦、镜头晃动等原因造成视频图像模糊的情况下,实现对人物身份的识别,从而可以适用于安全监控、行迹追踪、自动开门、自助取款支付等很多场景下由于各种条件所限只能拍摄低质量视频图像的情形。本专利技术的目的是这样实现的:一种面向低质量视频图像的人物身份识别方法,包括如下步骤:(1)视频图像采集:视频图像经过摄像头采样、量化、重计算以后转换为数字图像并输入、存储到帧存储器中;(2)目标图像检测:对数字图像进行基于几何和统计特征的图像分类,获取目标图像;(3)平移并截取目标图像的矩形区域;(4)人脸检测:对于任意一幅给定的目标图像的矩形区域,进行搜索以确定其中是否含有本文档来自技高网
...
一种面向低质量视频图像的人物身份识别方法与装置

【技术保护点】
1.一种面向低质量视频图像的人物身份识别方法,其特征在于,包括如下步骤:(1)视频图像采集:视频图像经过摄像头采样、量化、重计算以后转换为数字图像并输入、存储到帧存储器中;(2)目标图像检测:对数字图像进行基于几何和统计特征的图像分类,获取目标图像;(3)平移并截取目标图像的矩形区域;(4)人脸检测:对于任意一幅给定的目标图像的矩形区域,进行搜索以确定其中是否含有人脸,如果含有人脸则提取脸部的特征信息包括位置、大小和姿态信息;如果没有人脸则返回步骤(1)重新进行视频图像采集;(5)人脸识别,根据提取脸部的特征信息,判断是否为特定身份用户,如果不是特定身份用户则返回步骤(1),如果是特定身份用户则进行截取与提取脸部的特征信息,并发出身份识别结果。

【技术特征摘要】
1.一种面向低质量视频图像的人物身份识别方法,其特征在于,包括如下步骤:(1)视频图像采集:视频图像经过摄像头采样、量化、重计算以后转换为数字图像并输入、存储到帧存储器中;(2)目标图像检测:对数字图像进行基于几何和统计特征的图像分类,获取目标图像;(3)平移并截取目标图像的矩形区域;(4)人脸检测:对于任意一幅给定的目标图像的矩形区域,进行搜索以确定其中是否含有人脸,如果含有人脸则提取脸部的特征信息包括位置、大小和姿态信息;如果没有人脸则返回步骤(1)重新进行视频图像采集;(5)人脸识别,根据提取脸部的特征信息,判断是否为特定身份用户,如果不是特定身份用户则返回步骤(1),如果是特定身份用户则进行截取与提取脸部的特征信息,并发出身份识别结果。2.根据权利要求1所述的面向低质量视频图像的人物身份识别方法,其特征在于,所述的视频图像经过重计算以后转换为数字图像的具体步骤包括:(1.1)计算图像f(x,y)在各灰度级中像素值出现的概率q(r)T为图像中的最高灰度级,er为灰度级r的像素数,x、y为像素在图像中的横纵坐标,E为图像像素总数;(1.2)计算图像中各个灰度级所累计的像素概率密度u(r),u为图像的归一化累计直方图;i为标号;(1.3)重新计算图像各位置的像素值O(x,y);O(x,y)=(Omax-Omin)u[O(x,y)]+OminOmax、Omin分别为图像中最大以及最小的像素值,将重新计算后的图像表示为F(x,y)。3.根据权利要求2所述的面向低质量视频图像的人物身份识别方法,其特征在于,所述的对数字图像进行几何和统计特征的图像分类,获得目标图像的具体步骤如下:(2.1)采集a个数字图像数据,其中具有s个人脸图片组成的正样本集合和d个非人脸图片组成负样本集合,表示为F={(α1,β1),(α2,β2)...(αa,βa)},αi∈Gi,Gi为作为正、负样本的数字图像的特征向量,βi∈H={0,1},H为样本数据αi的标签;0为负样本标签,1为正样本标签;(2.2)正样本的权重初始化为负样本的权重初始化为(2.3)对每个样本αi的特征值训练建模,得到样本特征的弱分类器,c(αi)为样本数字图像的特征值,γ为阈值;(2.4)计算所有特征向量对应的弱分类器的权值vi,通过对弱分类器进行选择,误差最小的弱分类器级联为强分类器δi,其中vi的初始取值为样本αi对应的初始化权重值J(i);(2.5)通过选择的弱分类器权值vi重新赋值为viεi(1-θ)若第i个样本αi被正确分类,θ=0,反之θ=1,(2.6)得到最后的强分类器,通过该强分类器对数字图像进行强分类;根据步骤(2.6)的强分类结果,确定数字图像中是否属于包含人脸图片的目标图像。4.根据权利要求3所述的面向低质量视频图像的人物身份识别方法,其特征在于,所述的平移并截取目标图像的矩形区域的具体步骤包括:采用预定大小的矩形模板计算目标图像的矩形特征,用于脸部检测;所述矩形模板由第一矩形框和第二矩形框组合而成,两个矩形框在x方向和y方向上分别具有固定的间距;利用矩形模板的每个矩形框提取目标图像中的矩形区域;计算矩形模板特征值;判断矩形模板特征值是否大于预定的阈值,如果大于该阈值则将由矩形模板提取的矩形区域进行步骤(4)的人脸检测处理,如果不大于该阈值则将所述矩形模板在x方向和y方向移动预定的距离后重新进行截取目标图像的矩形区域的计算,直至遍历整个目标图像。5.根据权利要求4所述的面向低质量视频图像的人物身份识别方法,其特征在于,所述的人脸检测的具体步骤包括:(4.1)通过人脸特征数据库收集一定数量的特定人脸图像形成训练人脸图像集合,集合中每个人物需要包括一定数量的不同表情以及不同光线下的人脸图像,M张训练人脸图像的矩阵集合ζ,每张图片表示为m*n的矩阵σi;(4.2)计算训练人脸集合的矩阵N,N=ATA;A=[ρ1,ρ2,...,ρM]ρi为人脸图像与平均人脸图像的差值,ρi=σi-τ,遍历集合ζ中的矩阵并且进行累加,然后取其平均值,即得到平均图像τ计算矩阵N的特征向量以及特征值,特征向量μk为人脸图像与平均人脸图像的差值ρi的分布律,特征值并选择其中具有最高相关性的M个特征值对应的特征向量;(4.3)结合标准的训练图像集合产生特征脸模式向量ni=μiT(σi-τ);i=1,2,…M;(4.4)针对每一个已知的训练人物,依据由已知人物的原始训练图像计算得到的特征脸模式向量的均值计算人脸类向量设定阈值θk表示训练人脸类之间的最大可允许距离;设定阈值θ′k,表示人脸空间的最大可允许距离;(4.5)针对步骤3截取的矩形区域,计算其模式向量Ωi,与各个训练人脸类的距离ε,以及到人脸空间的距离εk;如果与训练人脸类的最小距离εk<θk,并且到人脸空间的距离ε<θ′k则认为待识别人脸属于该人脸类;如果与训练人脸类的最小距离εk≥θk,但是到人脸空间的距离ε<θ′k,则认为待识别人脸属于陌生人脸;(4.6)如果待识别人脸被识别为已知的训练人物,那么这个人脸图像将被加入到该人物的原始训练图像集合中,然后重新计算其特征脸。6.一种面向低质量视频图像的人物身份识别装置,其特征在于,包括视频图像采集模块、目标图像检...

【专利技术属性】
技术研发人员:刘丰
申请(专利权)人:特斯联北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1