一种细粒度图片处理方法、装置和存储介质制造方法及图纸

技术编号:21401094 阅读:29 留言:0更新日期:2019-06-19 07:34
本发明专利技术公开了一种细粒度图片处理方法、装置和存储介质。所述方法包括使用多个画框分别从待处理细粒度图片上剪切出相应的注意图像,将各所述注意图像的尺寸统一化,将尺寸统一化后的各所述注意图像分别输入到经过训练的相应的深度学习网络中进行处理,接收各所述深度学习网络分别输出的多通道特征图,对各所述多通道特征图的通道均进行降维处理,对经过降维处理的各所述多通道特征图进行融合处理和对所述融合处理的结果进行可视化计算,从而得到细节特征可视化结果等步骤。本发明专利技术所得到的注意图像具有足够的多样性,用于细粒度图片识别时具有较高的稳定性、可靠性、精确度和效率。本发明专利技术广泛应用于图像处理技术领域。

【技术实现步骤摘要】
一种细粒度图片处理方法、装置和存储介质
本专利技术涉及图像处理
,尤其是一种细粒度图片处理方法、装置和存储介质。
技术介绍
细粒度图片是指一类具有相似内容的图片,如包含“牧羊犬”的图片和包含“哈士奇”的图片,由于“牧羊犬”和“哈士奇”的视觉效果相近,仅在耳朵形状和毛色等细节特征上存在差异,因此识别和区分细粒度图片比识别和区分其他类型的图片更加困难,尤其是需要计算机或人工智能实现细粒度图片识别和区分功能时将面临更大的困难。人类辨别细粒度图片的过程是快速扫描全局图像,锁定需要重点关注的目标区域,然后再针对目标区域进行对比分析。计算机识别细粒度图片的算法中也参考了人类的这一过程,即从细粒度图片所提供的众多信息中提取出对当前识别任务目标最关键的信息并进行加权,使得后续图片识别过程的准确度得到很大提高,这一机制被称为视觉注意力机制。现有的视觉注意力机制算法存在的缺点主要在于,在目标区域的提取等环节很大程度依赖工作人员的经验去人工选择,这一方面造成了算法的不稳定,另一方面由于人工的参与造成了算法的效率和可靠性下降,而且缺乏对视觉注意力多样化的过程,无法对细粒度图片的细节特征进行处理。专利技本文档来自技高网...

【技术保护点】
1.一种细粒度图片处理方法,其特征在于,包括以下步骤:使用多个画框分别从待处理细粒度图片上剪切出相应的注意图像;各所述画框的尺寸以及在待处理细粒度图片上的位置均不相同;将各所述注意图像的尺寸统一化;将尺寸统一化后的各所述注意图像分别输入到经过训练的相应的深度学习网络中进行处理,接收各所述深度学习网络分别输出的多通道特征图;对各所述多通道特征图的通道均进行降维处理;对经过降维处理的各所述多通道特征图进行融合处理;对所述融合处理的结果进行可视化计算,从而得到细节特征可视化结果;所述细节特征可视化结果包含用于表示所述细粒度图片细节特征的信息。

【技术特征摘要】
1.一种细粒度图片处理方法,其特征在于,包括以下步骤:使用多个画框分别从待处理细粒度图片上剪切出相应的注意图像;各所述画框的尺寸以及在待处理细粒度图片上的位置均不相同;将各所述注意图像的尺寸统一化;将尺寸统一化后的各所述注意图像分别输入到经过训练的相应的深度学习网络中进行处理,接收各所述深度学习网络分别输出的多通道特征图;对各所述多通道特征图的通道均进行降维处理;对经过降维处理的各所述多通道特征图进行融合处理;对所述融合处理的结果进行可视化计算,从而得到细节特征可视化结果;所述细节特征可视化结果包含用于表示所述细粒度图片细节特征的信息。2.根据权利要求1所述的一种细粒度图片处理方法,其特征在于,所述方法还包括以下步骤:使用预先建立的全连接神经网络接收所述融合处理的结果;所述全连接神经网络的输出节点数被调整为自身需要的类别数;使用交叉熵代价函数作为损失函数进行反向传递,从而对全连接神经网络进行训练;经过训练后的所述全连接神经网络用于对其他细粒度图片的分类和分析。3.根据权利要求1所述的一种细粒度图片处理方法,其特征在于,所述将各所述注意图像的尺寸统一化这一步骤,是通过双线性插值的方式进行的。4.根据权利要求1所述的一种细粒度图片处理方法,其特征在于,所述深度学习网络为卷积神经网络,所述卷积神经网络包括依次串联的第一卷积层、第一批量正则化层、第一残差块组、第二残差块组、第三残差块组、第四残差块组和全局平均池化层;所述第一卷积层用于接收注意图像并进行卷积处理,所述第一批量正则化层用于对第一卷积层的卷积处理结果进行批量正则化处理,所述第一残差块组、第二残差块组、第三残差块组和第四残差块组用于增大所述卷积...

【专利技术属性】
技术研发人员:高英赵引罗雄文罗彭婷
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1