【技术实现步骤摘要】
一种害虫分类与检测方法
[0001]本专利技术涉及图像分析与处理的
,更具体地,涉及一种害虫分类与检测方法
。
技术介绍
[0002]计算机视觉是人工智能的一个重要分支,它有多个应用领域,如图像分类
、
目标检测
、
语义分割
、
实例分割
、
视频分类
、
人体关键点检测
、
场景文本识别和目标跟踪等
。
图像分类是其中最为基础的任务,主要解决图像内有什么的问题
。
而目标检测以图像分类为基础,不仅需要对图像中的每个目标进行分类,还需要精准定位每个目标
。
传统计算机视觉通过人工选择和设计特征,再利用机器学习方法如
SVM
等进行目标或像素点的分类,具有强主观性
、
高误判率等缺点
。
而深度学习技术,使计算机能自主学习和提取深度抽象的图像特征,既不需要人工选取特征,同时又能适应于不同复杂背景和光照条件的情况,具有更高的 ...
【技术保护点】
【技术特征摘要】
1.
一种害虫图像特征提取方法,其特征在于,包括:
S1.
获取害虫样本图像数据集,将数据集划分为训练集
、
验证集和测试集;
S2.
构建害虫图像特征提取模型,利用训练集对害虫图像特征提取模型进行训练,然后利用验证集对害虫图像特征提取模型进行评估,利用测试集测试害虫图像特征提取模型的有效性,得到训练好的害虫图像特征提取模型;
S3.
将待处理的害虫图像输入训练好的害虫图像特征提取模型,得到害虫图像特征图
。2.
根据权利要求1所述的害虫分类与检测方法,其特征在于,所述害虫图像特征提取模型包括依次连接的四个阶段
Stage 1
~
Stage 4
,每个阶段均包括依次连接的位置编码网络
、
多头相关性聚合器和前馈神经网络;在每个阶段中,提取害虫图像特征的过程如下:
SA.
若在
Stage 1
中,将数据集图像
X
in
输入
Stage 1
,通过二维卷积实现图像块内编码,得到特征图
X
in1
;若在
Stage2
~
Stage 4
中,将上个阶段输出的特征图
Z
k
‑1输入
Stagek
,通过二维卷积实现图像块内编码,得到特征图
X
ink
;其中,
k
=
2,3,4SB.
通过位置编码网络对
X
ink
进行位置编码,得到特征图
X
k
:
SC.
利用多头相关性聚合器对
X
k
的语义信息进行编码,聚合局部或全局的语义信息,得到特征图
Y
k
:
SD.
利用前馈神经网络对特征图
Y
k
进行进一步特征聚合,得到特征图
Z
k
。3.
根据权利要求2所述的害虫图像特征提取方法,其特征在于,
Stage 1
中的多头相关性聚合器为多头局部注意力模块
MHLA
;利用
MHLA
对
X1的语义信息进行编码,得到特征图
Y1:
Y1=
MHLA(X
norm1
)+X1X
norm1
=
BN(X1))
其中,对于将其展开为序列
L
=
H
×
W
,
C
为特征通道数;表示第一阶段多头相关性聚合器的第
n
个头,
U1为
MHLA
用于聚合多头特征的可学习参数矩阵;
V
n1
表示线性变换;为可学习的注意力得分矩阵;的计算公式如下:其中,
x
i
,x
j
是特征图中的任意两点,
(i
‑
j)
表示两点的相对位置关系,是关于两点相对位置关系的待学习权重,用于计算区域内的注意力得分并聚合内的特征
。4.
根据权利要求3所述的害虫图像特征提取方法,其特征在于,
Stage 2
中的多头相关性聚合器为多头坐标局部注意力模块
MHCLA
;利用
MHCLA
对
X2的语义信息进行编码,得到特征图
Y2:
Y2=
MHCLA(X
norm2
)+X2X
norm2
=
BN(X2))
其中,
CA
表示坐标注意力操作,表示第二阶段多头相关性聚合器的第
n
个头,
U2为
MHCLA
用于聚合多头特征的可学习参数矩阵;
V
n2
表示线性变换;为可学习的注意力得分矩阵;的计算公式如下:其中,
x
i
,x
j
是特征图中的任意两点,
(i
‑
j)
表示两点的相对位置关系,是关于两点相对位置关系的待学习权重,用于计算区域内的注意力得分并聚合内的特征
。5.
根据权利要求4所述的害虫图像特征提取方法,其特征在于,
Stage 3
中的多头相关性聚合器为多头坐标窗口注意力模块
MHCWA
;利用
MHCWA
对
X3的语义信息进行编码,得到特征图
Y3:
Y3=
MHCWA(X
norm3
)+X3X
norm3
=
LN(X3))
其中,
LN
表示层归一化,为
MHCWA
的可学习的注意力得分矩阵,的计算公式如下:其中,
Q
n3
和
K
n3
为两个待学习的参数矩阵,用于对输入进行线性变换;
d3=
C3/N3,用于归一化;
n
=
1,2,
…
,N3,表示
MHCWA
的多头相关性聚合器的注意力头序号
。6.
根据权利要求5所述的害虫图像特征提取方法,其特征在于,
Stage 4
中的多头相关性聚合器为多头全局注意力模块
MHGA
;利用
MHGA
对
X4的语义信息进行编码,得到特征图
Y4:
Y4=
MHGA(X
norm4
)+X4X
norm4
=
LN(X4))
其中,为
MHGA
的可学习的注意力得分矩阵,的计算公式如下:其中,
Q
n4
和
K
n4
为两个待学习的参数矩阵,用于对输入进行线性变换;
d4=
C4/N4,用于归一化;
n
=
1,2,
…
,N4,表示
MHGA
的多头相关性聚合器的注意力头序号
。7.
一种害虫分类方法,其特征在于,基于权利要求6所述的害虫图像特征提取方法,步骤
S3
得到害虫图像特征图后,对害虫进行分类,具体方法如下:所述害虫图像特征提取模型的输出端还连接有一条分类分支,所述分类分支通过线性层将特征图
Z4转换为维度等于类别个数的
logits
向量,再使用
Softmax
函数对
logits
向量进行归一化,得到各个类别的预测概率
p
=
[p0,p1,
…
,p
M
‑1]
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。