一种基于深度学习的人脸检测方法及系统技术方案

技术编号:20917962 阅读:19 留言:0更新日期:2019-04-20 09:59
本发明专利技术公开了一种基于深度学习的人脸检测方法及系统,用于人工智能领域。本发明专利技术提供的方法包括:收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,分为三个训练集;利用所述第一训练集对第一层神经网络进行训练得到P‑Net模型;通过P‑Net模型标注第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练得到R‑Net模型;通过R‑Net模型标注第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练得到O‑Net模型;级联P‑Net模型、R‑Net模型和O‑Net模型,以检测输入的人脸图像。本发明专利技术通过级联三层神经网络,可以逐层提升人脸检测精度,且能快速准确的获取到人脸检测框,从而加快人脸识别。

A Face Detection Method and System Based on Deep Learning

The invention discloses a face detection method and system based on deep learning, which is used in the field of artificial intelligence. The method provided by the invention includes: collecting the pictures of the marked face position, preprocessing the pictures to form the sample pictures of the same size, and dividing them into three training sets; training the first layer of neural network with the first training set to obtain the P_Net model; labeling the sample pictures of the second training set with the P_Net model, and then using the labeled second training set to get the second layer. Neural network is trained to get R_Net model; after annotating sample pictures in the third training set by R_Net model, O_Net model is trained by using the third training set after annotation; cascaded P_Net model, R_Net model and O_Net model are used to detect the input face images. The cascaded three-layer neural network can improve the accuracy of face detection layer by layer, and can quickly and accurately obtain the face detection frame, thereby speeding up face recognition.

【技术实现步骤摘要】
一种基于深度学习的人脸检测方法及系统
本专利技术涉及人工智能领域,尤其涉及一种基于深度学习的人脸检测方法及系统。
技术介绍
人脸识别作为计算机视觉的一个重要研究方向,技术研究与应用已经非常成熟。常见的人脸检测方法可分为深度学习类型和非深度学习类型。非深度学习类型是基于传统机器学习算法(如OpenCV),一般检测速度比较快,占用资源少,但准确程度不高,常用在弱CPU应用端(如摄像头)。而深度学习类型,通常是采用基于卷积神经网络模型,这种方式检测准确率较高,但检测速度慢,比较占用资源,所以多应用在计算能力较强的终端设备上。实际在采用深度学习类型的人脸检测方法时,人脸检测速度慢,难以获得实时的检测效果。有鉴于此,本专利技术提出一种在保障准确率的基础上,提升人脸检测速度的方法。
技术实现思路
本专利技术实施例提供了一种基于深度学习的人脸检测方法及系统,用于快速准确的进行人脸检测。在本专利技术实施例的第一方面,提供了一种人脸检测方法,包括:收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,并将所述样本图片分为第一训练集、第二训练集和第三训练集;利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型;通过所述P-Net模型标注所述第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练,得到R-Net模型;通过所述R-Net模型标注所述第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练,得到O-Net模型;级联所述P-Net模型、所述R-Net模型和所述O-Net模型,以检测输入的人脸图像。在本专利技术实施例的第二方面,提供了一种基于深度学习的人脸检测系统,包括:收集模块,用于收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,并将所述样本图片分为第一训练集、第二训练集和第三训练集;第一训练模块,用于利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型;第二训练模块,用于通过所述P-Net模型标注所述第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练,得到R-Net模型;第三训练模块,用于通过所述R-Net模型标注所述第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练,得到O-Net模型;级联模块,用于级联所述P-Net模型、所述R-Net模型和所述O-Net模型,以检测输入的人脸图像。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例中,通过分别对卷积神经网络的三层结构进行训练,基于前一层神经网络模型的检测结果,进行训练,进一步提升训练速度。通过级联三层神经网络网络对输入的人脸图像进行检测,基于从P-Net模型、所述R-Net模型和O-Net模型的级联,可以逐层提升人脸检测精度,且能快速准确的获取到人脸检测框,从而加快人脸识别。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的基于深度学习的人脸检测方法的流程示意图;图2为本专利技术实施例提供的基于深度学习的人脸检测系统的结构示意图;具体实施方式本专利技术实施例提供了一种基于深度学习的人脸检测方法及系统,用于提升人脸检测速度,同时保证识别精度。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。实施例一:请参阅图1,本专利技术实施例提供的基于深度学习的人脸检测方法的流程示意图,包括:S101、收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,并将所述样本图片分为第一训练集、第二训练集和第三训练集;收集包含人脸的图片时,在图片中标注人脸的位置,可以通过方框、坐标位置或像素点等方式标注,所述预处理操作可包括对图片大小剪裁、分辨率等进行调整。所述第一训练集、第二训练集和第三训练集中,优选的,为所述第一训练集分配最大数量的样本图片。由于P-Net模型对检测精度影响最大,使用数据量最大的样本图片对该模型进行训练,以保证P-Net模型的识别精度。同时需要简化R-Net模型和O-Net模型的训练集,防止其过度训练,即减少第二训练集和第三训练集的样本图片量。优选的,保证第一训练集、第二训练集和第三训练集的中样本图片的多样及均衡。S102、利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型;所述P-Net(ProposalNetwork)模型可以提取样本图片中人脸候选框,并对候选框筛选。可选的,所述P-Net模型可以获得样本图片中人脸区域的候选框和边界框的回归向量,通过计算边界框的回归,对所述候选框进行校准,并利用非极大值抑制合并达到预设重叠标准的候选框。通过所述P-Net模型可以过滤人脸候选框。可选的,设置卷积步长为2或4的卷积神经网络,取代最大池化层。对最耗时的P-Net模型,使用stride为2或4的CNN卷积,取代max_pooling(最大池化层)。这样可以生成更少的人脸检测候选框,减少R-Net模型处理压力,提升检测效率。S103、通过所述P-Net模型标注所述第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练,得到R-Net模型;所述R-Net模型中通过边界狂的回归和非极大值抑制(NMS)去除多余人脸候选框。通过所述R-Net模型可以极大减少候选框,降低复杂的同时可以提升人脸检测精度。S104、通过所述R-Net模型标注所述第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练,得到O-Net模型;所述O-Net模型用于进一步筛选去除多余人脸候选框。S105、级联所述P-Net模型、所述R-Net模型和所述O-Net模型,以检测输入的人脸图像。可选的,对所述所述P-Net模型、所述R-Net模型和O-Net模型任一模型的核心权重层,采用深度可分离卷积进行优化。采用深度分离卷积能极大降低计算量,减少人脸检测时间。上述基于深度学习的人脸检测系统,通过级联三个网络模型,对各自的神经网络模型设置对应训练量,使用深度分离卷积优化网络结构,并在R-Net模型中使用卷积步长替代卷积层,能大幅提高人脸检测效率,保障检测精度。为便于理解,结合图1所描述的实施例,下面对P-Net模型训练过程进行描述,示例性的:收集8万多张已经做好标注的人脸图片。然后使用专用数据处理工具把这些人脸图片转成12*12尺寸的正样本、负样本和部分样本的训练数据。使用adam优化器,初始学习率0.01,batch-size为384,每22000个iteration学习率就衰减为原来的0.1倍,训练30个epoch(轮)。每个epoch都保存一次模型,选择30个模型里面recall(召回率)最大的为最优模型。同样的,针对R-Net模型,准备13000张已本文档来自技高网...

【技术保护点】
1.一种基于深度学习的人脸检测方法,其特征在于,包括:收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,并将所述样本图片分为第一训练集、第二训练集和第三训练集;利用所述第一训练集对第一层神经网络进行训练,得到P‑Net模型;通过所述P‑Net模型标注所述第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练,得到R‑Net模型;通过所述R‑Net模型标注所述第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练,得到O‑Net模型;级联所述P‑Net模型、所述R‑Net模型和所述O‑Net模型,以检测输入的人脸图像。

【技术特征摘要】
1.一种基于深度学习的人脸检测方法,其特征在于,包括:收集已标注人脸位置的图片,对所述图片预处理形成相同尺寸的样本图片,并将所述样本图片分为第一训练集、第二训练集和第三训练集;利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型;通过所述P-Net模型标注所述第二训练集中样本图片后,利用标注后的第二训练集对第二层神经网络进行训练,得到R-Net模型;通过所述R-Net模型标注所述第三训练集中样本图片后,利用标注后的第三训练集对第三层神经网络进行训练,得到O-Net模型;级联所述P-Net模型、所述R-Net模型和所述O-Net模型,以检测输入的人脸图像。2.根据权利要求1所述的方法,其特征在于,所述将所述样本图片分为第一训练集、第二训练集和第三训练集还包括:为所述第一训练集分配最大数量的样本图片。3.根据权利要求1或2所述的方法,其特征在于,所述利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型还包括:所述P-Net模型可以获得样本图片中人脸区域的候选框和边界框的回归向量,通过计算边界框的回归,对所述候选框进行校准,并利用非极大值抑制合并达到预设重叠标准的候选框。4.根据权利要求1所述的方法,其特征在于,所述利用所述第一训练集对第一层神经网络进行训练,得到P-Net模型还包括:设置卷积步长为2或4的卷积神经网络,取代最大池化层。5.根据权利要求1所述的方法,其特征在于,对所述所述P-Net模型、所述R-Net模型和O-Net模型任一模型的核心权重层,采用深度可分离卷积进行优化。6.一种人脸检测...

【专利技术属性】
技术研发人员:覃辉谭卫军
申请(专利权)人:深圳神目信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1