基于深度学习的SSD的人脸检测方法技术

技术编号:18399377 阅读:1056 留言:0更新日期:2018-07-08 19:45
一种基于深度学习的SSD的人脸检测方法,所述方法包括以下步骤:(1)输入图像。(2)将得到的图片resize成300×300,并送入网络。(3)进行多层级的提取feature map。(4)在每个feature map中各个位置location,每个location对应多个default box。(5)对所有default box的特征分别回归其类别的置信度和default box的相对偏移量。(6)对于每个default box,回归出每个类别的class score。(7)根据回归的类别中人脸类别的class score,选取default box。(8)根据default box的预测结果可以知道人脸的倾斜角度。从而知道人脸的朝向。

【技术实现步骤摘要】
基于深度学习的SSD的人脸检测方法
本专利技术属于深度学习领域,具体涉及一种SSD(SingleShotMulti-boxesDetector,单镜头多箱式检测)人脸检测的方法。
技术介绍
人脸检测是一种在任意数字图像中找到人脸的位置并确定其大小的计算机技术,其研究具有重要的学术价值。人脸是一类具有相当复杂的细节变化的自然结构目标,对此类目标的挑战性在于:人脸由于外貌、表情、肤色等不同,具有模式的可变性;一般意义下的人脸上,可能存在眼镜、胡须等附属物;作为三维物体的人脸影像不可避免地受由光照产生的阴影的影响。人脸检测的目的是判断输入的人脸图像或者视频帧图像中是否有人脸存在,若存在人脸,则确定图像中人脸所在的位置,并进一步给出人脸中各个器官的具体位置、大小等信息。典型的人脸检测算法可以分为三大类:基于启发式的检测算法、基于肤色区域分割的检测算法和基于统计模板的检测算法。具体的方法有人工神经网络方法,Adaboost算法,特征脸检测算法以及样本学习方法等。深度学习(DeepLearning)是机器学习领域利用多层特征来建立数据之间复杂关系的技术,广泛应用在信号和信息处理领域。深度学习的概念源于人工神经网络的研究,含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。人脸检测算法中,特征选取的好坏对于实际应用的影响非常大,因此,选择一种能很好地表示某一对象的特征是解决实际问题的关键。然而,人为设计的特征,如Adaboost算法,时间代价很大,劳动成本也很高。基于这些问题,深度学习作为一个不需要人为参与的特征提取方法,可以通过自动学习来完成特征提取的任务。而目前较为高效的基于深度学习的人脸检测算法YOLO(YouOnlyLookOnce),虽然对物体的检测速度很快,达到了完全实时,但其对位置预测不够精确,对小物体效果不够理想。SSD即深度学习中一个最新的ObjectDetector算法,在多尺度下面计算特征,然后评估在该尺度下的区域存在的概率以及相关offset,是一种遍历所有区域的方式。
技术实现思路
为了克服现有算法无法同时保证人脸检测的高速率与高精度性,本专利技术提出一种基于SSD的人脸检测算法。其结合了YOLO和anchor进行检测,在多个featuremap上进行处理,使用图像在各个scale下各个位置的特征进行回归,既保证了速度,也保证了准确度。本专利技术解决其技术问题所采用的技术方案是:一种基于深度学习的SSD的人脸检测方法,所述方法包括以下步骤:1)输入图像。2)将得到的图片resize成300×300,并送入网络。3)进行多层级的提取featuremap。4)在每个featuremap中各个位置location,每个location对应多个defaultbox。5)对所有defaultbox的特征分别回归其类别的置信度和defaultbox的相对偏移量。6)对于每个defaultbox,回归出每个类别的classscore。7)根据回归的类别中人脸类别的classscore,选取defaultbox。8)根据defaultbox的预测结果可以知道人脸的倾斜角度。从而知道人脸的朝向。进一步,所述步骤1)中,输入的图像分为正方形或长方形的矩形。若为正方形,则直接进行步骤2);若为长方形,则从图像中取多个正方形的子图,并将每个子图进行步骤2)。再进一步,所述步骤4)中,由于对于featuremap中一个featuremapcell一个位置上的k个boxes中的每一个box,我们需要计算出c个类,每一个类的score,还有这个box相对于它的默认box的4个偏移值(offsets),于是,在featuremap中的每一个featuremapcell上,就需要有(c+4)×k个filters。对于一张m×n大小的featuremap,即会产生(c+4)×k×m×n个输出结果(defaultbox)。其中,每个featuremap的defaultbox的scale计算公式如下:其中,Smin和Smax分别表示最低层次和最高层次的scale,中间所有层次均匀分布,m表示featuremap的个数。更进一步,所述步骤5)中,defaultbox的相对偏移量为一个10维的向量,分别是Δx,Δy,Δw,Δh,Δlt(x,y),Δlb(x,y),Δrb(x,y)。其中:Δx:defaultbox中心点x坐标的偏移量Δy:defaultbox中心的y坐标的偏移量Δw:defaultbox的宽度的偏移量Δh:defaultbox的高度的偏移量Δlt(x,y):defaultbox的中心点与左上角点之间的向量的改变量Δlb(x,y):defaultbox的中心点与左下角点之间的向量的改变量Δrb(x,y):defaultbox的中心点与右上角点之间的向量的改变量本专利技术的有益效果主要表现在:在人脸检测过程中,深度学习的特征提取方法不需要人为参与,而是通过自动学习来完成特征提取的任务,大大提高了效率。同时SSD算法结合了YOLO和anchor进行检测,在多个featuremap上进行处理,使用图像在各个scale下各个位置的特征进行回归,使得检测速度快,精度高。具体实施方式下面对本专利技术作进一步描述。一种基深度学习的SSD的人脸检测方法,包括以下步骤:1)输入图像。输入的图像分为正方形或长方形的矩形。若为正方形,则直接进行步骤2);若为长方形,则从图像中取多个正方形的子图,并将每个子图进行步骤2)。2)将得到的图片resize成300*300,并送入网络。3)进行多层级的提取featuremap。分别提取conv4_3,fc7,conv8_2,conv9_2,conv10_2,pool11这6个层的featuremap。4)在每个featuremap中各个位置location,每个location对应多个defaultbox。由于对于featuremap中一个featuremapcell一个位置上的k个boxes中的每一个box,我们需要计算出c个类,每一个类的score,还有这个box相对于它的默认box的4个偏移值(offsets),于是,在featuremap中的每一个featuremapcell上,就需要有(c+4)×k个filters。对于一张m×n大小的featuremap,即会产生(c+4)×k×m×n个输出结果(defaultbox)。其中,每个featuremap的defaultbox的scale计算公式如下:其中,Smin和Smax分别表示最低层次和最高层次的scale,中间所有层次均匀分布,m表示featuremap的个数。因此,对于提取的6个featuremap,以Conv4_3层为例,Conv4_3层的featuremap的size为38×38×512,看做38×38的矩阵,矩阵的每个元素是512维的向量。在38×38的矩阵上每个点取3个不同长宽比的defaultbox。共有38x38x3本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的SSD的人脸检测方法,其特征在于:所述方法包括以下步骤:(1)输入图像。(2)将得到的图片resize成300×300,并送入网络。(3)进行多层级的提取feature map。(4)在每个feature map中各个位置location,每个location对应多个default box。(5)对所有default box的特征分别回归其类别的置信度和default box的相对偏移量。(6)对于每个default box,回归出每个类别的class score。(7)根据回归的类别中人脸类别的class score,选取default box。(8)根据default box的预测结果可以知道人脸的倾斜角度。从而知道人脸的朝向。

【技术特征摘要】
1.一种基于深度学习的SSD的人脸检测方法,其特征在于:所述方法包括以下步骤:(1)输入图像。(2)将得到的图片resize成300×300,并送入网络。(3)进行多层级的提取featuremap。(4)在每个featuremap中各个位置location,每个location对应多个defaultbox。(5)对所有defaultbox的特征分别回归其类别的置信度和defaultbox的相对偏移量。(6)对于每个defaultbox,回归出每个类别的classscore。(7)根据回归的类别中人脸类别的classscore,选取defaultbox。(8)根据defaultbox的预测结果可以知道人脸的倾斜角度。从而知道人脸的朝向。2.如权利要求1所述的基于深度学习的SSD的人脸检测方法,其特征在于:所述步骤1)中,输入的图像分为正方形或长方形的矩形。若为正方形,则直接进行步骤2);若为长方形,则从图像中取多个正方形的子图,并将每个子图进行步骤2)。3.如权利要求1或2所述的基于深度学习的SSD的人脸检测方法,其特征在于:所述步骤4)中,由于对于featuremap中一个featuremapcell一个位置上的k个boxes中的每一个box,我们需要计算出c个类,每一个类的score,还有这个box相对于它的默认box的4个偏移值(offsets),于是,在featuremap中的每一个featuremapcell上,就需要有(c+4)×k个filters。对于一张m×n大小的featuremap,即会产生(...

【专利技术属性】
技术研发人员:金海强朱毅李汉曦钱胜
申请(专利权)人:上海玄彩美科网络科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1