图像处理方法、装置及处理设备制造方法及图纸

技术编号:21090803 阅读:33 留言:0更新日期:2019-05-11 10:24
本发明专利技术提供了一种图像处理方法、装置及处理设备,涉及图像识别技术领域,该方法包括:获取待识别图像;将待识别图像输入目标识别网络;目标识别网络包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络;卷积计算层包括卷积块,残差计算层包括残差块;残差块包括至少两个依次连接的卷积块;卷积块包括至少一个通道不变卷积层;通道不变卷积层对输入特征图进行计算时,将输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道;通过目标识别网络对待识别图像进行姿势识别,得到姿势识别结果,姿势识别结果包括待识别图像所包含的目标的位置和模态。本发明专利技术实施例可以减少计算量、增大感受野,精准确定位置和模态。

【技术实现步骤摘要】
图像处理方法、装置及处理设备
本专利技术涉及图像识别
,尤其是涉及一种图像处理方法、装置及处理设备。
技术介绍
手势识别是不借助触摸屏等机械设备的无触人机交互的支柱技术,手势识别的实时与否决定着无触人机交互的普及与否。然而由于手部形变高、手部自遮挡和外部遮挡严重、背景噪音复杂、拍摄角度多变、光线强弱、红外强度不一等因素,针对红外摄像头的手势识别本身已是非常困难,尤其是不能实时、不能同时处理多只手的识别,且实时手势识别还受限于计算资源等,会更加难以实现。针对现有技术中图像识别的上述问题,目前尚未提出有效的解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种图像处理方法、装置及处理设备,可以减少神经网络模型的计算量,更精准地定位目标位置和识别目标模态。第一方面,本专利技术实施例提供了一种图像处理方法,包括:获取待识别图像;将所述待识别图像输入目标识别网络;所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络;所述卷积计算层包括卷积块,所述残差计算层包括残差块;所述残差块包括至少两个依次连接的卷积块;所述卷积块包括至少一个通道不变卷积层;所述通道不变卷积层对输入特征图进行计算时,将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道;通过所述目标识别网络对所述待识别图像进行姿势识别,得到姿势识别结果,所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。进一步,所述通过所述目标识别网络对所述待识别图像进行姿势识别的步骤,包括:通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图,并将所述第一特征图输入至所述残差计算层;通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取,得到所述待识别图像的第二特征图,并将所述第二特征图输入至输出层;通过所述输出层对所述第二特征图进行分类,并输出所述姿势识别结果。进一步,所述卷积块还包括第二卷积层、批量标准化层和修正线性单元;所述通道不变卷积层、所述第二卷积层、批量标准化层和修正线性单元依次连接;所述通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图的步骤,包括:通过所述通道不变卷积层对所述待识别图像的特征图进行卷积计算,得到与所述待识别图像通道的数量相同的初步特征图;通过所述第二卷积层对所述初步特征图进行卷积计算,得到包括预设数量通道的中间特征图;依次通过所述批量标准化层和所述修正线性单元对所述中间特征图进行批量标准化和非线性化,得到所述待识别图像的第一特征图。进一步,所述残差块包括至少两个依次连接的卷积块,底层的所述卷积块的输入端与上层的所述卷积块的输出端捷径连接;所述通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取,得到所述待识别图像的第二特征图的步骤,包括:将所述第一特征图输入底层的所述卷积块,以及通过捷径连接输送至上层的所述卷积块的输出端;各个所述卷积块逐级对所述第一特征图进行卷积处理;将逐级处理后得到的特征图与通过捷径连接输送的所述第一特征图相加,得到所述待识别图像的第二特征图。进一步,所述目标识别网络还包括作为分支网络的中间监督网络,所述特征金字塔神经网络和所述中间监督网络反向;所述中间监督网络包括多个依次连接的中间监督模块,所述中间监督模块与对应的所述残差计算层分别连接,用于在训练过程中接收对应的所述残差计算层输出的特征图以及上一层中间监督模块输出的特征图,相加得到中间监督特征图,并根据所述中间监督特征图进行损失函数优化及回传参数至所述对应的所述残差计算层。进一步,所述中间监督模块至少包括位置回归模块、分类模块和模态识别模块;在训练过程中,所述位置回归模块用于回归目标的位置,所述分类模块用于识别目标,所述模态识别模块用于识别目标的模态。第二方面,本专利技术实施例提供了一种图像处理装置,包括:获取模块,用于获取待识别图像;输入模块,用于将所述待识别图像输入目标识别网络;所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络;所述卷积计算层包括卷积块,所述残差计算层包括残差块;所述残差块包括至少两个依次连接的卷积块;所述卷积块包括至少一个通道不变卷积层;所述通道不变卷积层对输入特征图进行计算时,将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道;识别模块,用于通过所述目标识别网络对所述待识别图像进行姿势识别,得到姿势识别结果,所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。进一步,所述识别模块还用于:通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图,并将所述第一特征图输入至所述残差计算层;通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取,得到所述待识别图像的第二特征图,并将所述第二特征图输入至输出层;通过所述输出层对所述第二特征图进行分类,并输出姿势识别结果。第三方面,本专利技术实施例提供了一种处理设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述方法的步骤。第四方面,本专利技术实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面任一项所述方法的步骤。本专利技术实施例提供了一种图像处理方法、装置及处理设备,使用的目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络,其中卷积计算层包括卷积块,残差计算层包括残差块,残差块由至少两个依次连接的卷积块组成,每个卷积块包括至少一个通道不变卷积层,可以增大神经网络的感受野并降低网络的参数数量,从而减少神经网络的计算量。本公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本公开的上述技术即可得知。为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种处理设备的结构示意图;图2为本专利技术实施例提供的一种图像处理方法的流程图;图3为本专利技术实施例提供的CWCB模块的示意图;图4为本专利技术实施例提供的CWRB模块的示意图;图5为本专利技术实施例提供的目标识别网络结构的示意图;图6为本专利技术实施例提供的一种图像处理装置的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。由于图像识别过程中,受到形变、遮挡、背景噪音、拍摄角度、光线、红外强度等多种因素影响,目标识别的识别准确性不足且需要较多计算本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入目标识别网络;所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络;所述卷积计算层包括卷积块,所述残差计算层包括残差块;所述残差块包括至少两个依次连接的卷积块;所述卷积块包括至少一个通道不变卷积层;所述通道不变卷积层对输入特征图进行计算时,将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道;通过所述目标识别网络对所述待识别图像进行姿势识别,得到姿势识别结果,所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取待识别图像;将所述待识别图像输入目标识别网络;所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络;所述卷积计算层包括卷积块,所述残差计算层包括残差块;所述残差块包括至少两个依次连接的卷积块;所述卷积块包括至少一个通道不变卷积层;所述通道不变卷积层对输入特征图进行计算时,将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道;通过所述目标识别网络对所述待识别图像进行姿势识别,得到姿势识别结果,所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。2.根据权利要求1所述的方法,其特征在于,所述通过所述目标识别网络对所述待识别图像进行姿势识别的步骤,包括:通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图,并将所述第一特征图输入至所述残差计算层;通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取,得到所述待识别图像的第二特征图,并将所述第二特征图输入至输出层;通过所述输出层对所述第二特征图进行分类,并输出所述姿势识别结果。3.根据权利要求2所述的方法,其特征在于,所述卷积块还包括第二卷积层、批量标准化层和修正线性单元;所述通道不变卷积层、所述第二卷积层、批量标准化层和修正线性单元依次连接;所述通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理,得到所述待识别图像的第一特征图的步骤,包括:通过所述通道不变卷积层对所述待识别图像的特征图进行卷积计算,得到与所述待识别图像通道的数量相同的初步特征图;通过所述第二卷积层对所述初步特征图进行卷积计算,得到包括预设数量通道的中间特征图;依次通过所述批量标准化层和所述修正线性单元对所述中间特征图进行批量标准化和非线性化,得到所述待识别图像的第一特征图。4.根据权利要求2所述的方法,其特征在于,所述残差块包括至少两个依次连接的卷积块,底层的所述卷积块的输入端与上层的所述卷积块的输出端捷径连接;所述通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取,得到所述待识别图像的第二特征图的步骤,包括:将所述第一特征图输入底层的所述卷积块,以及通过捷径连接输送至上层的所述卷积块的输出端;各个所述卷积块逐级对所述第一特征图进行卷积处理;将逐级处理后得到的特征图与通过捷径连接输送的所述第...

【专利技术属性】
技术研发人员:陈文科姚聪孙晨
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1