图像处理方法和图像处理装置制造方法及图纸

技术编号:31224891 阅读:14 留言:0更新日期:2021-12-08 09:27
本申请提供了一种图像处理方法,包括:获取输入图像的第一特征图;根据所述第一特征图确定所述输入图像中的目标,所述输入图像中的目标为具有固定形态的对象;根据所述第一特征图确定所述输入图像中的场景,所述输入图像中的场景为具有变化形态的对象。第一特征图可以是特征提取网络的输出结果,特征提取网络分别与目标检测网络和场景分类网络连接,目标检测网络用于根据第一特征图确定输入图像中的目标,场景分类网络用于根据第一特征图确定输入图像中的场景,因此,上述方法可以正确识别出输入图像中具有固定形态的对象和变化形态的对象。对象。对象。

【技术实现步骤摘要】
图像处理方法和图像处理装置


[0001]本申请涉及人工智能领域,具体涉及一种图像处理方法和图像处理装置。

技术介绍

[0002]机器视觉是人工智能的一个分支,其目的是通过机器代替人眼对图像中的对象进行识别,将识别的结果展示给用户或者基于识别的结果控制系统的运行。
[0003]在图像识别过程中,待处理的图像例如是监控视频中的帧。一个帧可能同时包括具有固定形态的对象和变化形态的对象,其中,固定形态的对象例如是车辆、人等目标,变化形态的对象例如是人群拥堵、车祸现场等场景。虽然一些神经网络可以识别固定形态的对象,但是,在人群拥堵等场景中,相邻对象的距离较小,现有的神经网络难以识别人群中的固定形态的对象,也就无法判断人群拥堵等场景。如何识别这类图像中具有固定形态的对象和变化形态的对象是当前需要解决的问题。

技术实现思路

[0004]本申请提供了一种图像处理方法和图像处理装置,能够识别图像中具有固定形态的对象和变化形态的对象。
[0005]第一方面,提供了一种图像处理方法,包括:获取输入图像的第一特征图;根据所述第一特征图确定所述输入图像中的目标,所述输入图像中的目标为具有固定形态的对象;根据所述第一特征图确定所述输入图像中的场景,所述输入图像中的场景为具有变化形态的对象。
[0006]第一特征图可以是特征提取网络的输出结果,特征提取网络分别与目标检测网络和场景分类网络连接,目标检测网络用于根据第一特征图确定输入图像中的目标,场景分类网络用于根据第一特征图确定输入图像中的场景,因此,上述方法可以正确识别出输入图像中具有固定形态的对象和变化形态的对象。此外,由于特征提取网络的输出结果是目标检测网络和场景分类网络共用的数据,相比于通过“特征提取网络+目标检测网络”以及“特征提取网络+场景分类网络”这种图像处理方式,本申请提供的方法减少了图像处理所需的计算资源。
[0007]可选地,所述根据所述第一特征图确定所述输入图像中的场景,包括:对所述第一特征图进行多尺度划分,生成多个第二特征图,所述多个第二特征图的尺度互不相同;对所述多个第二特征图分别进行场景识别,确定所述输入图像中的场景。
[0008]不同的尺度对应输入图像中不同的感兴趣区域(region of interest,ROI)。由于同一类对象在不同视角下的尺度不同,对不同尺度的第二特征图进行场景识别,能够更加准确地识别出输入图像中的各类场景。
[0009]可选地,还包括:固定特征提取网络的参数,分别训练目标检测网络和场景分类网络,其中,所述特征提取网络用于处理所述输入图像生成所述第一特征图,所述目标检测网络用于根据所述第一特征图确定所述输入图像中的目标,所述场景分类网络用于根据所述
第一特征图确定所述输入图像中的场景。
[0010]上述方法能够提高目标检测网络和场景分类网络的收敛速度,进而提高训练效率。
[0011]可选地,所述分别训练目标检测网络和场景分类网络,包括:根据y
jk
和p
jk
训练所述场景分类网络,其中,所述y
jk
表示尺度为i的第二特征图的第j行第k列网络区域的真实标签,所述p
jk
表示所述尺度为i的第二特征图的第j行第k列网络区域的预测概率,所述尺度为i的第二特征图为基于所述第一特征图进行多尺度划分生成的多个第二特征图中的任意一个。
[0012]可选地,所述获取输入图像的第一特征图,包括:获取所述输入图像;对所述输入图像进行数据增强处理,生成增强的输入图像,所述数据增强处理包括以下处理中的至少一个:水平翻转、竖直翻转、亮度抖动、色度抖动、饱和度抖动;根据所述增强的输入图像生成所述第一特征图。
[0013]上述方法能够提高进行图像处理的神经网络的鲁棒性。
[0014]第二方面,本申请提供了一种图像处理装置,包括用于执行第一方面所述的方法的单元。该装置可以是终端设备或服务器,也可以是终端设备或服务器内的芯片。该装置可以包括输入单元和处理单元。
[0015]当该装置是终端设备或服务器时,该处理单元可以是处理器,该输入单元可以是收发器;该终端设备还可以包括存储单元,该存储单元可以是存储器;该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该终端设备执行第一方面所述的方法。
[0016]当该装置是终端设备或服务器内的芯片时,该处理单元可以是芯片内部的处理单元,该输入单元可以是输入/输出接口、管脚或电路等;该处理单元执行存储单元所存储的指令,以使该芯片执行第一方面所述的方法,该存储单元可以是该芯片内的存储单元(例如,寄存器、缓存等),也可以是位于该芯片外部的存储单元(例如,只读存储器、随机存取存储器等)。
[0017]第三方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储了计算机程序,该计算机程序被处理器执行时,使得处理器执行第一方面所述的方法。
[0018]第四方面,本申请提供了一种计算机程序产品,该计算机程序产品包括:计算机程序代码,当该计算机程序代码被处理器运行时,使得处理器执行第一方面所述的方法。
附图说明
[0019]图1是本申请提供的一种适用于本申请的系统的示意图;
[0020]图2是本申请提供的一种图像处理方法的示意图;
[0021]图3是本申请提供的另一种图像处理方法的示意图;
[0022]图4是本申请提供的一种图像处理装置的示意图;
[0023]图5是本申请提供的一种图像处理设备的示意图。
具体实施方式
[0024]下面将结合附图,对本申请的技术方案进行描述。
[0025]图1是本申请提供的一种适用于本申请的系统的示意图。
[0026]系统100包括预处理模块110、特征提取模块120、目标检测网络130和场景分类网络140。
[0027]预处理模块110用于对原始图像进行预处理,以方便后续处理。例如,原始图像的尺寸多种多样,预处理模块110可以通过双线性插值将任意尺寸的原始图像调整到目标检测网络130和场景分类网络140所需的尺寸(如608
×
608),还可以将原始图像的各通道的灰度值进行归一化,以便于目标检测网络130和场景分类网络140进行处理。
[0028]特征提取模块120用于提取预处理模块110输出的图像中的通用特征,其生成的结果可以称为特征图。特征提取模块120例如是深度网络darknet53或VGG19。
[0029]特征提取模块120输出的结果分别输入目标检测网络130和场景分类网络140。
[0030]目标检测网络130用于识别输入图像中具有固定形态的对象,例如,通过卷积网络从特征提取模块120输出的特征图中进一步提取特征,完成待检测目标的类别、大小和中心点位置的预测。
[0031]场景分类网络140用于识别输入图像中具有变化形态的对象,例如,通过卷积池化层从特征提取模块120输出的特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取输入图像的第一特征图;根据所述第一特征图确定所述输入图像中的目标,所述输入图像中的目标为具有固定形态的对象;根据所述第一特征图确定所述输入图像中的场景,所述输入图像中的场景为具有变化形态的对象。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征图确定所述输入图像中的场景,包括:对所述第一特征图进行多尺度划分,生成多个第二特征图,所述多个第二特征图的尺度互不相同;对所述多个第二特征图分别进行场景识别,确定所述输入图像中的场景。3.根据权利要求1或2所述的方法,其特征在于,还包括:固定特征提取网络的参数,分别训练目标检测网络和场景分类网络,其中,所述特征提取网络用于处理所述输入图像生成所述第一特征图,所述目标检测网络用于根据所述第一特征图确定所述输入图像中的目标,所述场景分类网络用于根据所述第一特征图确定所述输入图像中的场景。4.根据权利要求3所述的方法,其特征在于,所述分别训练目标检测网络和场景分类网络,包括:根据y
jk
和p
jk
训练所述场景分类网络,其中,所述y
jk
表示尺度为i的第二特征图的第j行第k列网络区域的真实标签,所述p
jk
表示所述尺度为i的第二特征图的第j行第k列网络区域的预测概率,所述尺度为i的第二特征图为基于所述第一特征图进行多尺度划分生成的多个第二特征图中的任意一个。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述获取输入图像的第一特征图,包括:获取所述输入图像;对所述输入图像进行数据增强处理,生成增强的输入图像,所述数据增强处理包括以下处理中的至少一个:水平翻转、竖直翻转、亮度抖动、色度抖动、饱和度抖动;根据所述增强的输入图像生成所述第一特征图。6.一种图像处理装置,其特征在于,包括处理单元,用于:获取输入图像的第一特征图;根据所述第一特征图确定所述输入图像中的目标,所述输入图像中的目标为具有固定形态的对象;根据所...

【专利技术属性】
技术研发人员:方帅刘杰
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1