一种基于RGB三分量分组注意力加权融合的图像分类方法技术

技术编号:34336209 阅读:47 留言:0更新日期:2022-07-31 03:01
本发明专利技术提供了一种基于RGB三分量分组注意力加权融合的图像分类方法,其中,方法包括:采集复杂环境下的目标图像,并进行降噪处理,得到降噪后的目标图像;分别提取所述降噪后的目标图像的RGB三通道分量图像。本发明专利技术的基于RGB三分量分组注意力加权融合的图像分类方法,引入RGB三分量,在残差网络模型中引入注意力机制,充分利用全局和局部颜色三分量特征进行特征提取,对于存在噪声干扰、颜色鲜艳的目标尤其是小目标分类效果较好。其是小目标分类效果较好。其是小目标分类效果较好。

【技术实现步骤摘要】
一种基于RGB三分量分组注意力加权融合的图像分类方法


[0001]本专利技术涉及图像分类和智能优化
,特别涉及一种基于RGB三分量分组注意力加权融合的图像分类方法。

技术介绍

[0002]随着计算机视觉技术的发展,交通视频监控、农作物的病虫害自动识别、工业产品的自动装备检测等应用对视觉识别的质量提出了更高的要求,如何对提取到的物体图像进行准确的分类成为有待于解决的难题。在实际应用场合中,拍摄的视频图像往往受到光照变化、目标遮挡、噪声干扰等因素的影响,图像中的目标难以检测,尤其是由于分辨率低、体积小等因素,一些微小目标更加难以检测,提取到的特征信息出现缺失,从而对检测结果造成误判,在复杂的场景环境下目标分类的准确率不高。
[0003]因此,亟需一种能够在复杂环境下进行目标特征准确提取的方法,提高目标分类的效果。

技术实现思路

[0004]本专利技术提供一种基于RGB三分量分组注意力加权融合的图像分类方法,引入RGB三分量,在残差网络模型中引入注意力机制,充分利用全局和局部颜色三分量特征进行特征提取,对于存在噪声干扰、颜色鲜艳的目标尤其是小目标分类效果较好。
[0005]本专利技术提供一种基于RGB三分量分组注意力加权融合的图像分类方法,包括:
[0006]采集复杂环境下的目标图像,并进行降噪处理,得到降噪后的目标图像;
[0007]分别提取所述降噪后的目标图像的RGB三通道分量图像;
[0008]利用预构建的卷积核,根据预设的卷积规则,对所述RGB三通道分量图像进行卷积操作,得到RGB三通道分量图像中各个中间卷积层级的特征图,所述中间卷积层级为两级残差网络结构,将中间卷积层级的输入与中间卷积层级卷积后的输出之和作为中间卷积层级的特征图;
[0009]对所述中间卷积层级的特征图,采用三级不同的卷积核构建金字塔卷积网络结构;
[0010]对所述金字塔卷积网络结构按照通道数目进行分组,形成若干个分组通道的独立的分组特征图;
[0011]对所述分组特征图引入注意力机制,分别提取分组特征图的分组通道特征和分组空间特征并赋予所述分组通道特征和分组空间特征不同的预设的权重,得到所述金字塔卷积网络结构的分组注意力加权融合后的特征图;
[0012]基于RGB三通道分量图像所有所述分组通道的分组注意力加权融合后的特征图,构成堆叠的分组特征图;
[0013]根据预设的金字塔残差网络结构,依次将所述堆叠的分组特征图进行特征叠加操作,得到上下文增强特征网络层的堆叠集合;
[0014]利用注意力机制网络对所述上下文增强特征网络层的堆叠集合进行注意力权重计算,得到注意力增强特征网络层的堆叠集合;
[0015]利用预训练的目标分类网络模型对所述注意力增强特征网络层的堆叠集合进行目标分类,得到所述复杂环境下各种目标的分类识别结果。
[0016]优选的,利用预构建的卷积核,根据预设的卷积规则,对所述RGB三通道分量图像进行卷积操作,得到RGB三通道分量图像中各个中间卷积层级的特征图,包括:
[0017]对所述RGB三通道分量图像,经过第1级卷积层,得到第1级卷积特征图X
1R
、X
1G
以及X
1B

[0018]对所述第1级卷积特征图X
1R
、X
1G
以及X
1B
,经过第2级卷积层,得到第2级卷积特征图X
2R
、X
2G
以及X
2B

[0019]对所述第2级卷积特征图X
2R
、X
2G
以及X
2B
,经过第3级卷积层,得到第3级卷积特征图X
3R
、X
3G
以及X
3B

[0020]对所述第3级卷积特征图X
3R
、X
3G
以及X
3B
,经过第4级卷积层,得到第4级卷积特征图X
4R
、X
4G
以及X
4B

[0021]优选的,所述中间卷积层级为两级残差网络结构,将中间卷积层级的输入与中间卷积层卷积后的输出之和作为中间卷积层级的特征图,包括:
[0022]所述第1级卷积特征图X
1R
、X
1G
以及X
1B
即为第1级融合卷积特征图M
1R
、M
1G
以及M
1B

[0023]将所述第1级融合卷积特征图M
1R
、M
1G
以及M
1B
和第2级卷积特征图X
2R
、X
2G
以及X
2B
作为输入,构建第一残差网络结构,经过卷积融合操作,得到第2级融合卷积特征图M
2R
、M
2G
以及M
2B

[0024]将所述第2级融合卷积特征图M
2R
、M
2G
以及M
2B
和第3级卷积特征图X
3R
、X
3G
以及X
3B
作为输入,构建第二残差网络结构,经过卷积融合操作,得到第3级融合卷积特征图M
3R
、M
3G
以及M
3B

[0025]将所述第3级融合卷积特征图M
3R
、M
3G
以及M
3B
和第4级卷积特征图X
4R
、X
4G
以及X
4B
作为输入,构建第三残差网络结构,经过卷积融合操作,得到第4级融合卷积特征图M
4R
、M
4G
以及M
4B

[0026]优选的,对所述中间卷积层级的特征图,采用三级不同的卷积核构建金字塔卷积网络结构,包括:
[0027]对4级融合卷积特征图M
iR
、M
iG
、M
iB
(i=1,2,3,4),采用卷积核大小为3的尺度进行卷积操作,构建低层金字塔卷积RGB三分量特征图P
i1R
、P
i1G
以及P
i1B
(i=1,2,3,4);
[0028]对4级融合卷积特征图M
iR
、M
iG
、M
iB
(i=1,2,3,4),采用卷积核大小为5的尺度进行卷积操作,构建中间层金字塔卷积RGB三分量特征图P
i2R
、P
i2G
以及P
i2B
(i=1,2,3,4);
[0029]对4级融合卷积特征图M
iR
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RGB三分量分组注意力加权融合的图像分类方法,其特征在于,包括:采集复杂环境下的目标图像,并进行降噪处理,得到降噪后的目标图像;分别提取所述降噪后的目标图像的RGB三通道分量图像;利用预构建的卷积核,根据预设的卷积规则,对所述RGB三通道分量图像进行卷积操作,得到RGB三通道分量图像中各个中间卷积层级的特征图,所述中间卷积层级为两级残差网络结构,将中间卷积层级的输入与中间卷积层级卷积后的输出之和作为中间卷积层级的特征图;对所述中间卷积层级的特征图,采用三级不同的卷积核构建金字塔卷积网络结构;对所述金字塔卷积网络结构按照通道数目进行分组,形成若干个分组通道的独立的分组特征图;对所述分组特征图引入注意力机制,分别提取分组特征图的分组通道特征和分组空间特征并赋予所述分组通道特征和分组空间特征不同的预设的权重,得到所述金字塔卷积网络结构的分组注意力加权融合后的特征图;基于RGB三通道分量图像所有所述分组通道的分组注意力加权融合后的特征图,构成堆叠的分组特征图;根据预设的金字塔残差网络结构,依次将所述堆叠的分组特征图进行特征叠加操作,得到上下文增强特征网络层的堆叠集合;利用注意力机制网络对所述上下文增强特征网络层的堆叠集合进行注意力权重计算,得到注意力增强特征网络层的堆叠集合;利用预训练的目标分类网络模型对所述注意力增强特征网络层的堆叠集合进行目标分类,得到所述复杂环境下各种目标的分类识别结果。2.如权利要求1所述的一种基于RGB三分量分组注意力加权融合的图像分类方法,其特征在于,利用预构建的卷积核,根据预设的卷积规则,对所述RGB三通道分量图像进行卷积操作,得到RGB三通道分量图像中各个中间卷积层级的特征图,包括:对所述RGB三通道分量图像,经过第1级卷积层,得到第1级卷积特征图X
1R
、X
1G
以及X
1B
;对所述第1级卷积特征图X
1R
、X
1G
以及X
1B
,经过第2级卷积层,得到第2级卷积特征图X
2R
、X
2G
以及X
2B
;对所述第2级卷积特征图X
2R
、X
2G
以及X
2B
,经过第3级卷积层,得到第3级卷积特征图X
3R
、X
3G
以及X
3B
;对所述第3级卷积特征图X
3R
、X
3G
以及X
3B
,经过第4级卷积层,得到第4级卷积特征图X
4R
、X
4G
以及X
4B
。3.如权利要求2所述的一种基于RGB三分量分组注意力加权融合的图像分类方法,其特征在于,所述中间卷积层级为两级残差网络结构,将中间卷积层级的输入与中间卷积层卷积后的输出之和作为中间卷积层级的特征图,包括:所述第1级卷积特征图X
1R
、X
1G
以及X
1B
即为第1级融合卷积特征图M
1R
、M
1G
以及M
1B
;将所述第1级融合卷积特征图M
1R
、M
1G
以及M
1B
和第2级卷积特征图X
2R
、X
2G
以及X
2B
作为输入,构建第一残差网络结构,经过卷积融合操作,得到第2级融合卷积特征图M
2R
、M
2G
以及M
2B
;将所述第2级融合卷积特征图M
2R
、M
2G
以及M
2B
和第3级卷积特征图X
3R
、X
3G
以及X
3B
作为输入,构建第二残差网络结构,经过卷积融合操作,得到第3级融合卷积特征图M
3R
、M
3G
以及M
3B

将所述第3级融合卷积特征图M
3R
、M
3G
以及M
3B
和第4级卷积特征图X
4R
、X
4G
以及X
4B
作为输入,构建第三残差网络结构,经过卷积融合操作,得到第4级融合卷积特征图M
4R
、M
4G
以及M
4B
。4.如权利要求3所述的一种基于RGB三分量分组注意力加权融合的图像分类方法,其特征在于,对所述中间卷积层级的特征图,采用三级不同的卷积核构建金字塔卷积网络结构,包括:对4级融合卷积特征图M
iR
、M
iG
、M
iB
(i=1,2,3,4),采用卷积核大小为3的尺度进行卷积操作,构建低层金字塔卷积RGB三分量特征图P
i1R
、P
i1G
以及P
i1B
(i=1,2,3,4);对4级融合卷积特征图M
iR
、M
iG
、M
iB
(i=1,2,3,4),采用卷积核大小为5的尺度进行卷积操作,构建中间层金字塔卷积RGB三分量特征图P
i2R
、P
i2G
以及P
i2B
(i=1,2,3,4);对4级融合卷积特征图M
iR
、M
iG
、M
iB
(i=1,2,3,4),采用卷积核大小为5的尺...

【专利技术属性】
技术研发人员:陈瑾杨国宇刘柱范浩楠史鸣凤
申请(专利权)人:盐城工学院技术转移中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1