当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于专用神经网络和图像预处理的秸秆图像分割方法技术

技术编号:38820715 阅读:12 留言:0更新日期:2023-09-15 19:59
本发明专利技术提出了一种基于专用神经网络和图像预处理的秸秆图像分割方法,以提高秸秆图像分割的准确率和效率,并实现复杂度和准确率的平衡。旨在解决秸秆农学图像分割任务。该算法首先通过无人机采集彩色RGB图像,并使用随机截取技术将图像尺寸限制为512

【技术实现步骤摘要】
一种基于专用神经网络和图像预处理的秸秆图像分割方法


[0001]本专利技术涉及图像处理领域,具体而言,涉及一种基于专用神经网络和图像预处理的秸秆图像分割方法。该方法可以用于农业领域中的秸秆处理和利用,提供准确的秸秆图像分割结果。

技术介绍

[0002]秸秆在农业中具有重要的意义。首先,秸秆的保护性工作对土壤保护至关重要。秸秆覆盖可以减少水分蒸发,降低土壤侵蚀,防止土壤质量的下降。其次,秸秆作为有机物的一种,可以被还田,有效地增加土壤的有机质含量,改善土壤结构和肥力。因此,秸秆的处理和利用对农业生产和环境保护都具有重要意义。
[0003]秸秆图像的分割在秸秆的后续处理和利用中起着基础性的作用。通过对秸秆图像进行分割,可以准确地提取出秸秆的区域和形状信息,为后续的处理和利用提供参考依据。例如,对秸秆图像进行分割可以帮助决定如何进行秸秆的收集、压实、堆垛等操作,也有助于进行秸秆的质量评估和相关农业研究。
[0004]然而,秸秆图像的分割任务面临一些挑战。首先,秸秆图像通常具有复杂的纹理、颜色和形状变化,使得常规的图像分割算法在分割秸秆图像时准确率较低。其次,目前的分割神经网络往往没有针对秸秆图像进行专门设计,缺乏对秸秆特征的有效学习和表达能力,导致分割准确率的进一步下降。此外,秸图像分割算法的复杂度和准确率之间的平衡也是一个具有挑战性的问题。
[0005]因此,有必要提出一种基于专用神经网络和图像预处理的秸秆图像分割方法,以提高秸秆图像分割的准确率和效率,并实现复杂度和准确率的平衡。通过引入针对秸秆图像的特征学习和表达机制,该算法能够更好地处理秸秆图像的复杂性,为后续的秸秆处理和利用工作提供准确的参考结果。

技术实现思路

[0006]本专利技术提出了一种基于专用神经网络和图像预处理的秸秆图像分割方法,主要包含以下内容:
[0007]步骤1、通过无人机采集彩色RGB图像,制作Straw320数据集,并针对数据集进行归一化处理。
[0008]步骤2、设计了一种基于秸秆图像灰度化方法,旨在保持图像的区分度同时降低后续模型的复杂度。
[0009]秸秆通常呈现黄色,背景通常为黑色。为了提高秸秆与背景的区分度,并减少网络的复杂度。根据黄色在RGB空间中的对应值(255,255,0),可以得出以下的灰度化系数:0.5,0.5,0。这意味着将红色通道的像素值与绿色通道的像素值进行加权平均,而忽略蓝色通道的像素值。因此,可以使用以下的灰度化公式:
[0010]P=0.5
×
R+0.5
×
G+0
×
B
[0011]其中,P表示灰度化后的像素值,R、G和B分别表示原始彩色图像中的红色、绿色和蓝色通道的像素值。通过这种方式,本专利技术增强了黄色通道的信息,同时减少了网络处理的复杂度,使得后续的图像分割任务更加高效而准确。
[0012]步骤3、提出了秸秆混合网络(SMN),用于处理预处理后的图像。该网络包括位置编码模块,旨在增强秸秆图像的相对信息,并且采用平衡复杂度和准确率的混合特征提取模块。
[0013]SMN网络借鉴了经典的U

Net分割网络结构,并进行了一些关键的改进,以更好地适应秸秆图像的特点。整体结构如图2所示。首先,本专利技术引入了位置编码模块,提供秸秆图像中秸秆与背景的位置信息。通过引入位置信息,网络可以更好地理解秸秆的空间分布,提高分割的准确性。其次,本专利技术设计了平衡复杂度和准确率的混合特征提取模块。这个模块结合了U

Net的跳跃连接机制,在保持网络复杂度可控的同时,提取多尺度的特征信息。综合不同尺度的特征,并进行特征融合和选择,网络可以更好地区分秸秆和背景,提高分割结果的准确性。最后,SMN网络采用了降采样和上采样操作,在编码器和解码器之间进行信息传递和特征恢复。降采样操7作通过最大池化层减少特征尺寸和参数数量,加快训练速度。上采样操作使用双线性插值法恢复特征的空间分辨率,保留更多细节信息。
[0014]步骤3

1、相对位置编码模块。在图像处理领域中,像素之间存在着丰富的交互信息,点间信息的有效提取可以提高整体任务的准确率。
[0015]本专利技术提出了相对位置编码模块,用一种简易的方式将相对位置坐标与原始图像进行耦合。为了降低算法复杂性,本专利技术将原始图像划分为大小相同的小块(即patch),然后将相对位置信息与每个小块的像素值进行融合。假设输入图像的宽度为W,高度为H,并且划分为大小为patch_size
×
patch_size的小块。那么每个小块的横纵坐标范围可以表示为:
[0016]col_indices=[0,1,...,W/(patch_size

1)][0017]row_indices=[0,1,...,H/(patch_size

1)][0018]为了进行相对位置编码,本专利技术定义了col_co和row_co这两个编码值,它们分别表示列和行的相对位置。这些编码值是通过将col_indices和row_indices除以(W/patch_size)和(H/patch_size)得到的,公式如下:
[0019]col_co=col_indices/(W/patch_size)
[0020]row_co=row_indices/(H/patch_size)
[0021]然后,本专利技术将这些编码值加入到原始数据中,以融合相对位置信息。由于原始数据经过归一化处理,取值范围在(0,1)之间,直接加入col_co和row_co编码可能会掩盖原图像数据信息,导致数据不平衡,进而影响网络的收敛性。因此,本专利技术引入了一个柔性参数β来限制相对位置信息的影响,公式如下:
[0022]P

=P+β(col_co+row_co)
[0023]其中P∈R
W
×
H
×1,P

∈R
W
×
H
×1。
[0024]步骤3

2、混合特征提取模块(Mixed

extract feature module)在秸秆分割任务中扮演关键角色,旨在实现准确度和复杂度之间的平衡。为了应对这一挑战,本专利技术根据Encoder

Decoder的设计原理提出了一种混合特征提取模块,它融合了卷积操作和自适应注意力机制,以实现更有效的图像特征提取。
[0025]该模块首先利用卷积操作对图像进行局部特征提取。卷积操作能够捕捉图像中相邻特征之间的空间关系,并保持特征维度不变。这样一来,本专利技术能够充分利用图像的局部信息,提取丰富的局部特征。
[0026]其次,混合特征提取模块引入了自适应注意力机制,用于提取图像全局特征之间的相关性。自适应注意力机制通过学习特征之间的权重,能够自动调整不同特征的重要性,从而更准确地捕捉图像的全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.本发明提出了一种基于专用神经网络和图像预处理的秸秆图像分割方法,主要包含以下步骤:步骤1,通过无人机采集彩色RGB图像,制作Straw320数据集,并针对数据集进行归一化处理;步骤2,设计了一种基于秸秆图像灰度化方法,旨在保持图像的区分度同时降低后续模型的复杂度;步骤3,提出了秸秆混合网络SMN,用于处理预处理后的图像,该网络包括位置编码模块,旨在增强秸秆图像的相对信息,并且采用平衡复杂度和准确率的混合特征提取模块。2.根据权利要求1所述的一种基于专用神经网络和图像预处理的秸秆图像分割方法,其特征在于所述的步骤2中,设计了一种基于秸秆图像灰度化方法,旨在保持图像的区分度同时降低后续模型的复杂度;秸秆通常呈现黄色,背景通常为黑色,为了提高秸秆与背景的区分度,并减少网络的复杂度,根据黄色在RGB空间中的对应值255,255,0,可得出以下的灰度化系数:0.5,0.5,0,这意味着将红色通道的像素值与绿色通道的像素值进行加权平均,而忽略蓝色通道的像素值,可使用以下的灰度化公式:P=0.5
×
R+0.5
×
G+0
×
B其中,P表示灰度化后的像素值,R、G和B分别表示原始彩色图像中的红色、绿色和蓝色通道的像素值,通过方式,增强了黄色通道的信息,同时减少了网络处理的复杂度,使得后续的图像分割任务更加高效而准确。3.根据权利要求1所述的一种基于专用神经网络和图像预处理的秸秆图像分割方法,其特征在于,步骤3中,所述SMN网络借鉴了经典的U

Net分割网络结构,首先,引入位置编码模块,提供秸秆图像中秸秆与背景的位置信息,通过引入位置信息,网络理解秸秆的空间分布,提高分割的准确性;其次,通过平衡复杂度和准确率的混合特征提取模块,所述模块结合了U

Net的跳跃连接机制,在保持网络复杂度可控的同时,提取多尺度的特征信息,通过综合不同尺度的特征,并进行特征融合和选择,使网络准确地区分秸秆和背景,从而提高分割结果的准确性;最后,所述SMN网络采用了降采样和上采样操作,在编码器和解码器之间进行信息传递和特征恢复,降采样操作通过最大池化层减少特征尺寸和参数数量,加快训练速度,上采样操作使用双线性插值法恢复特征的空间分辨率,保留更多细节信息。4.根据权利要求3所述的一种基于专用神经网络和图像预处理的秸秆图像分割方法,其特征在于,步骤3

1,相对位置编码模块,在图像处理领域中,像素之间存在着丰富的交互信息,点间信息的有效提取可以提高整体任务的准确率;所述相对位置编码模块,用一种简易的方式将相对位置坐标与原始图像进行耦合,为了降低算法复杂性,将原始图像划分为大小相同的小块patch,然后将相对位置信息与每个小块的像素值进行融合,假设输入图像的宽度为W,高度为H,并且划分为大小为patch_size
×
patch_size的小块,那么每个小块的横纵坐标范围可以表示为:col_indices=[0,1,...,W/(patch_size

1)]row_indices[0,1,...,H/(patch_size

1)]
为了进行相对位置编码,定义了col_co和row_co这两个编码值,它们分别表示列和行的相对位置,这些编码值是通过将col_indices和row_indices除以(W/patch_size)和(H/patch_size)得到的,公式如下:col_co=col_indices/(W/patch_size)row_co=row_indices/(H/patch_size)然后,将...

【专利技术属性】
技术研发人员:刘振泽胡闻捷臧一凡陈金炎董迪锴王成喜孙吉胡海洋
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1