模型训练方法、人体识别方法、装置、设备及存储介质制造方法及图纸

技术编号:19746116 阅读:18 留言:0更新日期:2018-12-12 04:53
本发明专利技术实施例提供一种模型训练方法、人体识别方法、装置、设备及存储介质。该方法包括:获取用于训练人体识别模型的样本图像;在该样本图像依次经过该多个第一卷积层处理时,根据该每个第一卷积层输出的第一特征图,确定该每个第一卷积层对应的第二特征图;根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域;根据检测出的人体区域或人体部位区域,以及该样本图像中标注的人体区域或人体部位区域,确定该人体识别模型的参数。本发明专利技术实施例提高了人体区域或人体部位区域的检测精度。

【技术实现步骤摘要】
模型训练方法、人体识别方法、装置、设备及存储介质
本专利技术实施例涉及计算机
,尤其涉及一种模型训练方法、人体识别方法、装置、设备及存储介质。
技术介绍
现有技术中,通过拍摄设备拍摄的视频或图像中可能会包括人体,有时候需要确定图像中的人体区域或人体部位区域。但是现有技术中,对图像中人体区域或人体部位区域的检测精度较低。
技术实现思路
本专利技术实施例提供一种模型训练方法、人体识别方法、装置、设备及存储介质,以提高人体区域或人体部位区域的检测精度。第一方面,本专利技术实施例提供一种模型训练方法,包括:获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。第二方面,本专利技术实施例提供一种人体识别方法,包括:根据第一方面得到的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。第三方面,本专利技术实施例提供一种模型训练装置,包括:第一获取模块,用于获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;第二获取模块,用于在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;第一确定模块,用于根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;第二确定模块,用于根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;第三确定模块,用于根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。第四方面,本专利技术实施例提供一种人体识别装置,包括:人体识别模块,用于根据如第三方面所述的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。第五方面,本专利技术实施例提供一种设备,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现第一方面或第二方面所述的方法。第六方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面或第二方面所述的方法。本专利技术实施例提供的模型训练方法、人体识别方法、装置、设备及存储介质,通过对高层卷积层输出的特征图和低层卷积层输出的特征图进行融合,使得融合后得到的特征图不仅具有低层卷积层输出的特征,也有高层卷积层输出的特征,当低层卷积层采用融合后得到的特征图对样本图像中的人体区域或人体部位区域进行识别时,可提高人体区域或人体部位区域的检测精度。附图说明图1为本专利技术实施例提供的模型训练方法流程图;图2为本专利技术另一实施例提供的深度神经网络模型的示意图;图3为本专利技术另一实施例提供的模型训练方法流程图;图4为本专利技术实施例提供的模型训练装置的结构示意图;图5为本专利技术实施例提供的一种设备的结构示意图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本专利技术提供的模型训练方法,旨在解决现有技术的如上技术问题。下面以具体地实施例对本专利技术的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本专利技术的实施例进行描述。图1为本专利技术实施例提供的模型训练方法流程图。本专利技术实施例针对现有技术的如上技术问题,提供了模型训练方法,该方法具体步骤如下:步骤101、获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层。在本实施例中,所述人体识别模型具体可以是深度神经网络模型。该深度神经网络模型可以运行在模型训练装置中,该模型训练装置可以是终端设备例如移动终端、计算机等,也可以是该终端设备的部件,另外,该模型训练装置还可以是服务器,或者是该服务器的部件。具体的,如图2所示,该深度神经网络模型包括数据层20、多个第一卷积层例如第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25、第一卷积层26、以及第一损失层27;此处只是示意性说明,并不限定第一卷积层的个数,可以理解,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25、第一卷积层26只是该深度神经网络模型包括的所有卷积层中的几个。在对该深度神经网络模型进行训练之前,需要获取用于训练该深度神经网络模型的样本图像,可选的,从预设的视频中获取多个图像,对该多个图像中的每个图像进行尺度缩放、角度旋转、色彩空间的扰动增强、区域抽取等处理中的至少一种处理,使得对每个图像进行前述至少一种处理后得到多个新的图像。在本实施例中,该多个图像和每个图像对应的多个新的图像构成本实施例中用于训练该深度神经网络模型的样本图像。步骤102、在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图。可以理解,用于训练该深度神经网络模型的样本图像在如图2所示的数据层20中。本实施例以其中一个样本图像为例,进行示意性说明。可以理解,该样本图像依次经过如图2所示的多个第一卷积层处理时,每个第一卷积层至少输出一个特征图,此处,将每个第一卷积层输出的特征图记为第一特征图。例如,第一卷积层21对该样本图像处理后得到特征图a,第一卷积层22对该样本图像处理后得到特征图b,第一卷积层23对该样本图像处理后得到特征图c,依次类推,第本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。2.根据权利要求1所述的方法,其特征在于,距离所述数据层越近的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越小;距离所述数据层越远的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越大。3.根据权利要求2所述的方法,其特征在于,距离所述数据层越近的第一卷积层引出的分支用于检测所述样本图像中越小的人体区域或人体部位区域;距离所述数据层越远的第一卷积层引出的分支用于检测所述样本图像中越大的人体区域或人体部位区域。4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图,包括:根据所述第一卷积层的下一个第一卷积层输出的第一特征图,以及所述下一个第一卷积层之后的所有第一卷积层输出的第一特征图,确定所述下一个第一卷积层对应的第二特征图;根据所述第一卷积层输出的第一特征图,以及所述下一个第一卷积层对应的第二特征图,确定所述第一卷积层对应的第二特征图。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一卷积层输出的第一特征图,以及所述下一个第一卷积层对应的第二特征图,确定所述第一卷积层对应的第二特征图,包括:根据所述第一卷积层输出的第一特征图的大小,对所述下一个第一卷积层对应的第二特征图进行放大;将所述第一卷积层输出的第一特征图和放大后的所述下一个第一卷积层对应的第二特征图进行叠加得到所述第一卷积层对应的第二特征图。6.根据权利要求1所述的方法,其特征在于,所述分支包括多个第二损失层,所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的大小在同一预设范围内,且所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的长宽比不同。7.一种人体识别方法,其特征在于,包括:根据如权利要求1-6任一项所述的方法训练得到的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。8.一种模型训练装置,其特征在于,包括:第一获取模块,用于获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一...

【专利技术属性】
技术研发人员:李旭斌王健亢乐刘泽宇迟至真张成月文石磊包英泽陈明裕丁二锐刘霄孙昊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1