一种图片检测的方法和相关装置制造方法及图纸

技术编号:24997168 阅读:27 留言:0更新日期:2020-07-24 17:59
本申请公开了一种图片检测的方法和相关装置,该方法包括:基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络进行预先训练,获得用于同时检测人脸和人头的目标检测模型;获取包括人脸和人头的待检测图片;利用目标检测模型对待检测图片进行检测,获得待检测图片中目标人脸框和目标人头框。可见,通过卷积神经网络同时学习人脸特征和人头特征得到目标检测模型,仅利用该模型即可同时检测人脸的位置信息和人头的位置信息,使得检测算法复杂度降低,计算量减小,不仅节省计算资源,而且减少计算时间,能够满足人脸识别技术在实际应用中对于实时性的需求。

【技术实现步骤摘要】
一种图片检测的方法和相关装置
本申请涉及数据处理
,尤其涉及一种图片检测的方法和相关装置。
技术介绍
人脸具有唯一性和不易被复制性,为身份鉴别提供了必要的前提,使得人脸识别技术适用于身份识别和人机交互等应用场景。在进行人脸识别过程中首先需要明确识别对象,并在识别对象移动时保持识别对象的不变性,即,在人脸识别过程中需要进行人脸跟踪。实际应用中,用户常常出现低头或者转头等动作导致某些瞬间人脸不可见,仅仅基于人脸信息进行跟踪容易导致跟踪中断,为了保持跟踪的稳定性,在利用人脸信息的基础上,还需要利用人头信息作为辅助信息帮助跟踪。现有技术中,一般使用基于卷积神经网络的人头检测器和基于卷积神经网络的人脸检测器这两个检测器,分别获取人头的位置信息和人脸的位置信息。但是,专利技术人经过研究发现,采用两个基于卷积神经网络的检测器分别获取人头的位置信息和人脸的位置信息,导致检测算法的算法复杂度高,计算量较大,不仅需要消耗较多的计算资源,而且计算时间急剧增加,难以满足人脸识别技术在实际应用中对于实时性的需求。
技术实现思路
有鉴于此,本申请实施例提供一种图片检测的方法和相关装置,使得检测算法复杂度降低,计算量减小,不仅节省计算资源,而且减少计算时间,能够满足人脸识别技术在实际应用中对于实时性的需求。第一方面,本申请实施例提供了一种图片检测的方法,该方法包括:获取待检测图片,所述待检测图片包括人脸和人头;利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框;所述目标检测模型是基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络预先训练获得的。可选的,所述目标检测模型的训练过程包括:基于所述图片样本和所述卷积神经网络中共用特征提取网络,获得所述图片样本对应的特征图;所述特征图包括人脸特征和人头特征;基于所述特征图和所述卷积神经网络中人脸、人头分类定位器,获得所述图片样本中预测人脸框和预测人头框;基于所述预测人脸框、所述预测人头框、所述人脸标签、所述人脸框位置信息、所述人头标签和所述人头框位置信息,利用目标损失函数训练更新所述卷积神经网络的网络参数;将训练更新完成后的卷积神经网络确定为所述目标检测模型。可选的,所述共用特征提取网络包括深度可分离卷积模块。可选的,所述目标损失函数包括人头分类损失函数、人头位置预测损失函数、人脸分类损失函数和人脸位置预测损失函数。可选的,所述目标检测模型包括目标共用特征提取网络以及目标人脸、目标人头分类定位器;对应地,所述利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框,包括:基于所述待检测图片和所述目标共用特征提取网络,获得所述待检测图片对应的目标特征图;所述目标特征图包括目标人脸特征和目标人头特征;基于所述目标特征图和所述目标人脸、目标人头分类定位器,获得所述待检测图片中目标人脸框和目标人头框。可选的,在所述获得所述图片样本对应的特征图之后,还包括:基于所述特征图和所述卷积神经网络中多尺度特征提取融合模块,获得所述图片样本对应的融合特征图;所述多尺度特征提取融合模块由空洞卷积和普通卷积构成,所述融合特征图包括人脸特征、人头特征以及人脸和人头临近图片语义信息;对应地,所述基于所述特征图和所述卷积神经网络中人脸、人头分类定位器,获得所述图片样本中预测人脸框和预测人头框,具体为:基于所述融合特征图和所述人脸、人头分类定位器,获得所述图片样本中预测人脸框和预测人头框。可选的,所述目标检测模型包括目标共用特征提取网络、目标多尺度特征提取融合模块以及目标人脸、目标人头分类定位器;对应地,所述利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框,包括:基于所述待检测图片和所述目标共用特征提取网络,获得所述待检测图片对应的目标特征图;基于所述目标特征图和所述目标多尺度特征提取融合模块,获得所述待检测图片对应的目标融合特征图,所述目标融合特征图包括目标人脸特征、目标人头特征以及目标人脸和目标人头临近图片语义信息;基于所述目标融合特征图和所述目标人脸、目标人头分类定位器,获得所述待检测图片中目标人脸框和目标人头框。第二方面,本申请实施例提供了一种图片检测的装置,该装置包括:获取单元,用于获取待检测图片,所述待检测图片包括人脸和人头;第一获得单元,用于利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框;所述目标检测模型是基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络预先训练获得的。第三方面,本申请实施例提供了一种终端设备,该终端设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述第一方面任一项所述的图片检测的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面任一项所述的图片检测的方法。与现有技术相比,本申请至少具有以下优点:采用本申请实施例的技术方案,首先,基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络进行预先训练,获得用于同时检测人脸和人头的目标检测模型;然后,获取包括人脸和人头的待检测图片;利用目标检测模型对待检测图片进行检测,获得待检测图片中目标人脸框和目标人头框。由此可见,通过卷积神经网络同时学习人脸特征和人头特征得到目标检测模型,仅利用该模型即可同时检测人脸的位置信息和人头的位置信息,使得检测算法复杂度降低,计算量减小,不仅节省计算资源,而且减少计算时间,能够满足人脸识别技术在实际应用中对于实时性的需求。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请实施例中一种应用场景所涉及的系统框架示意图;图2为本申请实施例提供的一种图片检测的方法的流程示意图;图3为本申请实施例提供的一种目标检测模型的训练示意图;图4为本申请实施例提供的一种人脸、人头分类定位器和目标损失函数的示意图;图5为本申请实施例提供的一种多尺度特征提取融合模块的提取融合示意图;图6为本申请实施例提供的一种图片检测的装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本文档来自技高网
...

【技术保护点】
1.一种图片检测的方法,其特征在于,包括:/n获取待检测图片,所述待检测图片包括人脸和人头;/n利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框;所述目标检测模型是基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络预先训练获得的。/n

【技术特征摘要】
1.一种图片检测的方法,其特征在于,包括:
获取待检测图片,所述待检测图片包括人脸和人头;
利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框;所述目标检测模型是基于同时标注人脸标签、人脸框位置信息、人头标签和人头框位置信息的图片样本以及卷积神经网络预先训练获得的。


2.根据权利要求1所述的方法,其特征在于,所述目标检测模型的训练过程包括:
基于所述图片样本和所述卷积神经网络中共用特征提取网络,获得所述图片样本对应的特征图;所述特征图包括人脸特征和人头特征;
基于所述特征图和所述卷积神经网络中人脸、人头分类定位器,获得所述图片样本中预测人脸框和预测人头框;
基于所述预测人脸框、所述预测人头框、所述人脸标签、所述人脸框位置信息、所述人头标签和所述人头框位置信息,利用目标损失函数训练更新所述卷积神经网络的网络参数;
将训练更新完成后的卷积神经网络确定为所述目标检测模型。


3.根据权利要求2所述的方法,其特征在于,所述共用特征提取网络包括深度可分离卷积模块。


4.根据权利要求2所述的方法,其特征在于,所述目标损失函数包括人头分类损失函数、人头位置预测损失函数、人脸分类损失函数和人脸位置预测损失函数。


5.根据权利要求2所述的方法,其特征在于,所述目标检测模型包括目标共用特征提取网络以及目标人脸、目标人头分类定位器;
对应地,所述利用目标检测模型对所述待检测图片进行检测,获得所述待检测图片中目标人脸框和目标人头框,包括:
基于所述待检测图片和所述目标共用特征提取网络,获得所述待检测图片对应的目标特征图;所述目标特征图包括目标人脸特征和目标人头特征;
基于所述目标特征图和所述目标人脸、目标人头分类定位器,获得所述待检测图片中目标人脸框和目标人头框。


6.根据权利要求2所述的方法,其特征在于,在所述获得所述图片样本对应的特征图之后,还包括:
基于所述特征图和所述卷积神经网络中多尺度特征提取融合模块,获得所...

【专利技术属性】
技术研发人员:谢强周峰
申请(专利权)人:北京爱笔科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1