图像处理方法、装置及处理设备制造方法及图纸

技术编号：21090803 阅读：33 留言：0更新日期：2019-05-11 10:24

本发明专利技术提供了一种图像处理方法、装置及处理设备，涉及图像识别技术领域，该方法包括：获取待识别图像；将待识别图像输入目标识别网络；目标识别网络包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络；卷积计算层包括卷积块，残差计算层包括残差块；残差块包括至少两个依次连接的卷积块；卷积块包括至少一个通道不变卷积层；通道不变卷积层对输入特征图进行计算时，将输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道；通过目标识别网络对待识别图像进行姿势识别，得到姿势识别结果，姿势识别结果包括待识别图像所包含的目标的位置和模态。本发明专利技术实施例可以减少计算量、增大感受野，精准确定位置和模态。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置及处理设备
本专利技术涉及图像识别
，尤其是涉及一种图像处理方法、装置及处理设备。
技术介绍
手势识别是不借助触摸屏等机械设备的无触人机交互的支柱技术，手势识别的实时与否决定着无触人机交互的普及与否。然而由于手部形变高、手部自遮挡和外部遮挡严重、背景噪音复杂、拍摄角度多变、光线强弱、红外强度不一等因素，针对红外摄像头的手势识别本身已是非常困难，尤其是不能实时、不能同时处理多只手的识别，且实时手势识别还受限于计算资源等，会更加难以实现。针对现有技术中图像识别的上述问题，目前尚未提出有效的解决方案。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种图像处理方法、装置及处理设备，可以减少神经网络模型的计算量，更精准地定位目标位置和识别目标模态。第一方面，本专利技术实施例提供了一种图像处理方法，包括：获取待识别图像；将所述待识别图像输入目标识别网络；所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络；所述卷积计算层包括卷积块，所述残差计算层包括残差块；所述残差块包括至少两个依次连接的卷积块；所述卷积块包括至少一个通道不变卷积层；所述通道不变卷积层对输入特征图进行计算时，将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道；通过所述目标识别网络对所述待识别图像进行姿势识别，得到姿势识别结果，所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。进一步，所述通过所述目标识别网络对所述待识别图像进行姿势识别的步骤，包括：通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理，得到所述待识别图像的...

【技术保护点】
1.一种图像处理方法，其特征在于，包括：获取待识别图像；将所述待识别图像输入目标识别网络；所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络；所述卷积计算层包括卷积块，所述残差计算层包括残差块；所述残差块包括至少两个依次连接的卷积块；所述卷积块包括至少一个通道不变卷积层；所述通道不变卷积层对输入特征图进行计算时，将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道；通过所述目标识别网络对所述待识别图像进行姿势识别，得到姿势识别结果，所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。

【技术特征摘要】
1.一种图像处理方法，其特征在于，包括：获取待识别图像；将所述待识别图像输入目标识别网络；所述目标识别网络为包括依次连接的多个卷积计算层和多个残差计算层的特征金字塔神经网络；所述卷积计算层包括卷积块，所述残差计算层包括残差块；所述残差块包括至少两个依次连接的卷积块；所述卷积块包括至少一个通道不变卷积层；所述通道不变卷积层对输入特征图进行计算时，将所述输入特征图的每个通道单独进行卷积变换得到输出特征图的一个通道；通过所述目标识别网络对所述待识别图像进行姿势识别，得到姿势识别结果，所述姿势识别结果包括所述待识别图像所包含的目标的位置和模态。2.根据权利要求1所述的方法，其特征在于，所述通过所述目标识别网络对所述待识别图像进行姿势识别的步骤，包括：通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理，得到所述待识别图像的第一特征图，并将所述第一特征图输入至所述残差计算层；通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取，得到所述待识别图像的第二特征图，并将所述第二特征图输入至输出层；通过所述输出层对所述第二特征图进行分类，并输出所述姿势识别结果。3.根据权利要求2所述的方法，其特征在于，所述卷积块还包括第二卷积层、批量标准化层和修正线性单元；所述通道不变卷积层、所述第二卷积层、批量标准化层和修正线性单元依次连接；所述通过所述卷积计算层的卷积块对所述待识别图像进行卷积处理，得到所述待识别图像的第一特征图的步骤，包括：通过所述通道不变卷积层对所述待识别图像的特征图进行卷积计算，得到与所述待识别图像通道的数量相同的初步特征图；通过所述第二卷积层对所述初步特征图进行卷积计算，得到包括预设数量通道的中间特征图；依次通过所述批量标准化层和所述修正线性单元对所述中间特征图进行批量标准化和非线性化，得到所述待识别图像的第一特征图。4.根据权利要求2所述的方法，其特征在于，所述残差块包括至少两个依次连接的卷积块，底层的所述卷积块的输入端与上层的所述卷积块的输出端捷径连接；所述通过所述残差计算层的至少一个残差块对所述第一特征图进行特征提取，得到所述待识别图像的第二特征图的步骤，包括：将所述第一特征图输入底层的所述卷积块，以及通过捷径连接输送至上层的所述卷积块的输出端；各个所述卷积块逐级对所述第一特征图进行卷积处理；将逐级处理后得到的特征图与通过捷径连接输送的所述第...

【专利技术属性】
技术研发人员：陈文科，姚聪，孙晨，
申请(专利权)人：北京旷视科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人