一种基于特征融合和视觉感受野网络的多尺度人脸检测方法技术

技术编号:25709722 阅读:53 留言:0更新日期:2020-09-23 02:56
本发明专利技术提出一种基于特征融合和视觉感受野网络的多尺度人脸检测方法,以VGG‑16为基础网络,由视觉感受野网络、空洞卷积网络共同组成本发明专利技术的网络结构,同时增加了网络的宽度和深度。在不同的卷积层提取不同分辨率的特征,根据不同层的分辨率采用不同方法提取候选框。在较低层的特征上,采用随机密集采样获取大量小尺度候选框,尽可能地匹配到更多真实样本。又通过对不同层的特征进行融合,使得融合特征同时包含了高低层的信息。高层特征适用于大尺度人脸的检测,低层特征适用于小尺度人脸的检测。本发明专利技术对于多尺度人脸尤其是小尺度人脸具有较好的检测效果。

【技术实现步骤摘要】
一种基于特征融合和视觉感受野网络的多尺度人脸检测方法
本专利技术涉及人脸检测技术,具体涉及一种基于特征融合和视觉感受野网络的多尺度人脸检测技术。
技术介绍
人脸特征作为生物特征中的一种,相对于指纹、虹膜、语音等特征,更为直接方便,易于用户接受,有着广泛的应用领域。人脸识别技术可以便捷、安全地识别身份。表情识别有助于研究人物情绪和心理状态,被应用于交通管理如疲劳驾驶领域。而人脸检测作为人脸特征提取的第一步,直接关系到后续人脸处理技术的精度,具有重要的研究意义。人脸检测主要是从视频或者图像中标记出人脸的位置,涉及到分类和边框回归两种技术。现实情况下,由于拍摄环境的复杂性,使得人脸图像中存在着多种尺度的人脸,又因为伴随着遮挡、旋转等一系列因素,多尺度尤其是小尺度人脸检测存在着漏检、精度低等各种问题。因此,如何处理多尺度问题,是人脸检测技术的重要研究内容。
技术实现思路
本专利技术所要解决的技术问题是,针对多尺度尤其是小尺度人脸检测效果不佳的情况,提出了多尺度人脸检测方法。本专利技术为解决上述技术问题所采用的技术方案本文档来自技高网...

【技术保护点】
1.一种基于特征融合和视觉感受野网络的多尺度人脸检测方法,包括训练步骤与测试步骤,其特征在于,训练步骤包括:/nS1构建检测网络结构:检测网络包括特征提取网络、特征融合网络、候选框生成模块以及输出层;特征提取网络以VGG-16为基础网络连接视觉感受野网络;/nS2特征提取:特征提取网络接收输入有标签的人脸图像,在网络的不同层提取特征,获取多尺度的特征图;/nS3特征融合:特征融合网络自上而下将来自特征提取网络高层的特征上采样后与低层特征结合形成融合特征输出至候选框生成模块;/nS4生成候选框:候选框生成模块根据不同层融合特征提取不同尺度候选框;针对低层融合特征图,采用随机密集采样生成更多小尺度...

【技术特征摘要】
1.一种基于特征融合和视觉感受野网络的多尺度人脸检测方法,包括训练步骤与测试步骤,其特征在于,训练步骤包括:
S1构建检测网络结构:检测网络包括特征提取网络、特征融合网络、候选框生成模块以及输出层;特征提取网络以VGG-16为基础网络连接视觉感受野网络;
S2特征提取:特征提取网络接收输入有标签的人脸图像,在网络的不同层提取特征,获取多尺度的特征图;
S3特征融合:特征融合网络自上而下将来自特征提取网络高层的特征上采样后与低层特征结合形成融合特征输出至候选框生成模块;
S4生成候选框:候选框生成模块根据不同层融合特征提取不同尺度候选框;针对低层融合特征图,采用随机密集采样生成更多小尺度候选框,以匹配更多小尺度人脸样本;
S5生成训练样本:计算各候选框的交并比IoU,根据IoU值与预设值的比较将候选框分成人脸或非人脸样本;
S6将人脸和非人脸样本输入至检测网络中进行训练,检测网络中输出层输出候选框位置与候选框的人脸/非人脸二分类结果并计算损失后反馈至检测网络直至完成训练。


2.如权利要求1所述方法,其特征在于,特征提取网络以VGG-16为基础网络连接视觉感受野网络的具体方法是:
S11:去除VGG-16的最后3个全连接层,只保留前13个卷积层作为VGG-16基础网络;
S12:在VGG-16基础网络后,连接2个视觉感受野网络;在视觉感受野网络后再连接1个空洞卷积层和2个普通卷积层。


3.如权利要求2所述方法,其特征在于,视觉感受野网络由4个并行的子网络组成;第1个子网络分别进行卷积核为1×1、3×3的卷积操作和2个卷积核为3×3、扩张率为2的空洞卷积操作;第2个子网络分别进...

【专利技术属性】
技术研发人员:刘欣刚王文涵钟鲁豪李辰琦汪卫彬朱超
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1