【技术实现步骤摘要】
一种使用多尺度特征提取的锦鲤鱼检测与识别方法
[0001]本专利技术属于深度学习图像检测的
,特别是涉及一种锦鲤品质的检测与识别的方法。
技术介绍
[0002]近年来,深度学习大火,它是机器学习领域中的一个研究方向,它能学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。而基于深度学习的目标检测领域,它定义为计算机对于给定的图像或者视频来判断其中是否包含目标物体,如果包含目标物体则需要给出目标在图像或者视频里的位置及类别信息。目标检测的运用领域多种多样,例如安全防控、企业业务、自动驾驶等。
[0003]我国终将成为世界上最大的锦鲤市场,锦鲤市场有巨大的发展潜力,锦鲤种类多,外形美观,观赏价值高,市场上销量比较稳定。锦鲤的繁殖能力高,对环境的适应性强、容易养活、产量高,从目前锦鲤的市场行情,以 ...
【技术保护点】
【技术特征摘要】
1.一种使用多尺度特征提取的锦鲤鱼检测与识别方法,其特征在于:该检测与识别方法按照如下步骤进行:(1)数据收集过程:获取锦鲤鱼的若干图片并标注,将其划分为一定比例的训练集和验证集;(2)图片处理及特征提取过程:传输标记好的图片送到马赛克数据增强和自适应缩放的预处理,然后传入到主要模型的主干网络中,在主干网络中进行图片的特征提取,之后会通过一个多尺度特征提取模块进行锦鲤鱼的多尺度特征提取,从而使该方法能够检测不同尺度大小的锦鲤;主要模型处理过程包括:经过主干网络处理后的特征图经过一个多尺度特征提取模块和编解码器模块处理,多尺度特征提取模块进行锦鲤鱼的多尺度特征提取,从而使该方法能够检测不同尺度大小的锦鲤;编解码器模块提升小目标检测的性能;经过主干网络处理后的特征图传入颈部模块,在颈部模块中特征图通过双向加权特征金字塔的连接方式进行加强特征提取,同时在检测头处添加了CA注意力模块,使其能够将锦鲤鱼在图片上的位置信息嵌入到通道中,至此主要模型检测完毕;(3)进入训练过程:输出端通过最后从CA注意力模块输出的4个有效特征层给出边界框和置信度:采用非极大值抑制方法,筛选掉重复的边界框,得出预测框,将预测框与标注工具产生框进行对比,并采用GIoU损失函数计算损失,再利用损失函数做反向传播,从而调整权重,其中GIoU损失公式如下:A:标注框矩形;B:预测框矩形;C:两个框形成的图像的最小外接矩形,即同时包含了预测框和真实框的最小框的面积;重复上述过程使其逐渐收敛,并通过验证集的测试不断调整参数,以使其具有泛化能力和精度提升,最终得到锦鲤的识别。2.根据权利要求1所述的一种使用多尺度特征提取的锦鲤鱼检测与识别方法,其特征在于:在多尺度特征提取模块中的小尺度特征提取过程步骤中,原始特征图输入到小尺度特征提取过程中,首先会分开进行一次压缩图片的通道数和两次小尺度卷积核的特征提取,然后将这三个结果合并除通道数以外的维度,这里指的是宽度和高度的维度,此时图片的维度就变成了THW*C;T代表的是批量输入图片的数量,H代表高度,W代表宽度,C代表通道数,刚才的三个结果的维度就都变成了THW*C;然后将压缩通道数之后矩阵转置的结果与第一个小尺度卷积核特征提取的结果做矩阵点乘运算,得到每帧中每个像素对其他所有帧所有像素的关系,点乘得到的结果的维度就变成了THW*THW,即THW*C与C*THW点乘,然后对该自相关性特征进行softmax操作,可以得到值域为[0,1]的结果;再将该结果与第二个小尺度卷积核特征提取的结果进行矩阵的点乘操作,此时的维度就是THW*THW与THW*C的点乘运算,得到的结果维度是THW*C;至此,多尺度特征提取模块中
的小尺度特征提取过程已全部完成,而中尺度及大尺度的处理过程与小尺度特征提取过程完全相同,不同点在于中尺度和大尺度提取过程中使用的卷积核大小与小尺度特征提取卷积核不同,所以该模块才能提取不同尺度的特征,在提取三种尺度特征后会产生三个不同尺度的特征图,此时再将这三张特征图在通道维度上进行堆叠,会得到一张新的特征图,然后将该特征图调整到和原始输入特征图相同的通道数,最后将此特征图和原始特征图通过矩阵相加从而输出,至此,整个多尺度特征提取模块已讲解完毕。3.根据权利要求1所述的一种使用多尺度特征提取的锦鲤鱼检测与识别方法,其特征在于:该方法的传入图片首先进行Mosaic数据增强、图片自适应缩放、旋转、拼接等以扩充数据集,以便于后续模型训练过程;接下来经过Mosaic数据增强的图片会经过一系列的特征提取过程传送到上述的多尺度特征提取模块中,在这里主要模型提取到了多尺度特征。4.根据权利要求1所述的一种使用多尺度特征提取的锦鲤鱼检测与识别方法,其特征在于:该方法的编解码器模块是一种残差结构,该结构分为主干部分和残差边部分,残差边...
【专利技术属性】
技术研发人员:汤永华,石非凡,林森,张志鹏,孟妍君,刘兴通,
申请(专利权)人:沈阳工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。