基于YOLOv5网络模型的目标识别方法及装置制造方法及图纸

技术编号:35296461 阅读:24 留言:0更新日期:2022-10-22 12:43
本发明专利技术公开了一种基于YOLOv5网络模型的目标识别方法及装置,其中所述方法包括:获取待识别的目标图像并输入至YOLOv5算法网络模型中,以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作,识别所述目标图像内所有待识别目标的位置,生成所述目标图像的目标识别结果。本发明专利技术提供的一种基于YOLOv5网络模型的目标识别方法,基于GhostNet为主干网络的同时引入了CA注意力机制,可以减少网络模型的计算开销,使目标检测模型的网络结构更为轻量化,且能够提高对个体较小的待测目标以及大面积团簇重叠的多目标识别精度。积团簇重叠的多目标识别精度。积团簇重叠的多目标识别精度。

【技术实现步骤摘要】
基于YOLOv5网络模型的目标识别方法及装置


[0001]本专利技术涉及计算机视觉和深度学习
,特别是涉及一种基于YOLOv5网络模型的目标识别方法及装置。

技术介绍

[0002]近年来,基于深度学习的目标检测方法,直接通过深层卷积网络结构自动学习图像的高阶特征而不需要手动设计特征,在提升对象检测任务的精度的同时还提高了检测效率。这类基于深度学习的目标检测方法一般分为基于候选区域的方法和基于回归的方法。其中基于候选区域的方法主要包括Fast R-CNN、Faster R-CNN和R-CNN,这类方法虽然准确,但计算成本很高,检测速度慢;而基于回归的方法主要包括YOLO和SSD,这类方法具有较好的检测速度和精度,因而得到了广泛的应用。
[0003]YOLOv5算法是一种检测精度高、速度快的检测算法,在开源数据集上有良好的效果。但是在果园荔枝果实数量检测等遮挡目标尤其是小目标检测等场景下存在检测精度不够的问题,现有YOLOv5的网络结构大多采用CSPDarknet53作为主干网络,对图片进行特征提取,其中还包含CBS结构以及C3结构,无法避免因为大量卷积操作造成神经网络的计算开销大的问题。

技术实现思路

[0004]本申请提供了一种基于YOLOv5网络模型的目标识别方法及装置,用于轻量化目标检测模型的同时提高小目标物体检测的精度。
[0005]第一方面,本申请提供了一种基于YOLOv5网络模型的目标识别方法,包括:获取待识别的目标图像;
[0006]将所述目标图像输入至YOLOv5算法网络模型中,以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作,识别所述目标图像内所有待识别目标的位置,生成所述目标图像的目标识别结果;其中,所述YOLOv5算法网络模型中的主干网络在N个预设位置处的Ghost botteneck层后引入CA注意力机制,N为大于等于4的正整数。
[0007]GhostNet是针对轻量级网络进行的研究,主要用于解决大量卷积操作造成神经网络的计算开销大的问题。在初始神经网络模型中引入GhostNet作为主干网络取代原先YOLOv5模型的主干网络,提高检测速度。同时,对基于GhostNet的主干网络进一步进行优化,引入CA注意力机制。一方面CA注意力机制简单灵活,几乎不会造成计算开销,可以轻量化网络模型;另一方面,CA注意力机制还能捕获方向感知和位置感知的信息,使模型可以更加精准的定位和识别待测目标,提高目标检测精度。通过本申请提供的一种目标模型构建方法对现有YOLOv5目标检测模型进行训练优化,可以使目标检测模型的网络结构更为轻量化,且能够提高对个体较小的待测目标以及大面积团簇重叠的多目标识别精度。
[0008]在一种实现方式中,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目
标图像执行卷积操作,具体包括:
[0009]对所述主干网络中每一Ghost botteneck层的输入目标图像执行缩略预设倍数卷积通道的卷积操作,生成第一特征图;
[0010]对所述第一特征图进行卷积操作,生成每一所述Ghost botteneck层对应的目标图像特征图。这样,相较于直接根据样本图像的尺寸进行卷积操作,先采用预设个数的卷积核生成一部分特征图,再基于生成的特征图进行卷积操作生成另一部分特征图从而完成对整个样本图像的卷积操作,可以减少卷积核的使用数量,降低计算开销,实现网络模型的轻量化。
[0011]在一种实现方式中,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作,具体为:
[0012]对引入CA注意力机制的每个所述Ghost botteneck层执行注意力操作;其中,所述注意力操作包括:使用两个预设尺寸的池化核对Ghostbotteneck层对应的目标图像特征图每个通道的水平坐标和垂直坐标进行编码,生成水平方向感知特征图和垂直方向感知特征图;将所述水平方向感知特征图和所述垂直方向感知特征图进行拼接,生成第一特征图;根据预设公式获取所述第一特征图在水平方向和垂直方向的注意力权重,生成注意力权重特征图。
[0013]在一种实现方式中,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作后,还包括:
[0014]选取所述主干网络中若干个预设位置处的Ghost botteneck层输出四个预设尺寸的目标图像特征图;
[0015]将所述四个预设尺寸的目标图像特征图进行特征融合,输出对应四个预设尺寸的融合特征图,
[0016]对所述四个预设尺寸的融合特征图执行剪枝操作。
[0017]在一种实现方式中,所述对所述四个预设尺寸的融合特征图执行剪枝操作,具体包括:
[0018]将第一预设尺寸的融合特征图、第二预设尺寸的融合特征图和第三预设尺寸的融合特征图分别输入至检测头进行目标位置检测,生成三个预设尺度下所述目标图像内的目标识别结果;
[0019]引入深度可分离卷积对第四预设尺寸的融合特征图进行目标位置检测。这样,在特征融合的过程中引入深度可分离卷积,解除普通卷积核个数和步长的限制,代替了池化操作的作用,在节省内存消耗的同时可以进一步提高模型的检测精度。
[0020]在一种实现方式中,所述检测头为三分支检测头,具体为:
[0021]第一分支用于检测目标框的类别;
[0022]第二分支用于检测目标框是否为前景或背景;
[0023]第三分支用于检测目标框的坐标信息。
[0024]在一种实现方式中,所述将第一预设尺寸的融合特征图、第二预设尺寸的融合特征图和第三预设尺寸的融合特征图分别输入至检测头进行目标位置检测,生成三个预设尺度下所述目标图像内的目标识别结果,具体包括:
[0025]对每个所述预设尺寸的融合特征图进行降维,生成统一通道数的对应预设尺寸的
第一分支特征图;
[0026]对每个所述预设尺寸的融合特征图对应的所述第一分支特征图进行卷积操作,生成对应预设尺寸的第二分支特征图和第三分支特征图;
[0027]将每个预设尺寸的融合特征图对应的第一分支特征图、第二特征图和第三特征图进行合并,生成第一预设尺寸检测特征图、第二预设尺寸检测特征图和第三预设尺寸检测特征图;
[0028]对所述第一预设尺寸检测特征图、第二预设尺寸检测特征图和第三预设尺寸检测特征图进行目标位置检测,生成三个预设尺度检测特征图内的目标识别结果。
[0029]第二方面,本申请还提供一种基于YOLOv5网络模型的目标识别装置,包括获取模块和识别模块,具体为:
[0030]所述获取模块用于获取待识别的目标图像;
[0031]所述识别模块用于将所述目标图像输入至YOLOv5算法网络模型中,以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作,识别所述目标图像内所有待识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5网络模型的目标识别方法,其特征在于,包括:获取待识别的目标图像;将所述目标图像输入至YOLOv5算法网络模型中,以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作,识别所述目标图像内所有待识别目标的位置,生成所述目标图像的目标识别结果;其中,所述YOLOv5算法网络模型中的主干网络在N个预设位置处的Ghost botteneck层后引入CA注意力机制,N为大于等于4的正整数。2.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法,其特征在于,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作,具体包括:对所述主干网络中每一Ghost botteneck层的输入目标图像执行缩略预设倍数卷积通道的卷积操作,生成第一特征图;对所述第一特征图进行卷积操作,生成每一所述Ghost botteneck层对应的目标图像特征图。3.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法,其特征在于,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作,具体为:对引入CA注意力机制的每个所述Ghost botteneck层执行注意力操作;其中,所述注意力操作包括:使用两个预设尺寸的池化核对Ghost botteneck层对应的目标图像特征图每个通道的水平坐标和垂直坐标进行编码,生成水平方向感知特征图和垂直方向感知特征图;将所述水平方向感知特征图和所述垂直方向感知特征图进行拼接,生成第一特征图;根据预设公式获取所述第一特征图在水平方向和垂直方向的注意力权重,生成注意力权重特征图。4.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法,其特征在于,所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作后,还包括:选取所述主干网络中若干个预设位置处的Ghost botteneck层输出四个预设尺寸的目标图像特征图;将所述四个预设尺寸的目标图像特征图进行特征融合,输出对应四个预设尺寸的融合特征图,对所述四个预设尺寸的融合特征图执行剪枝操作。5.如权利要求4所述的一种基于YOLOv5网络模型的目标识别方法,其特征在于,所述对所述四个预设尺寸的融合特征图执行剪枝操作,具体包括:将第一预设尺寸的融合特征图、第二预设尺寸的融合特征图和第三预设尺寸的融合特征图分别输入至检测...

【专利技术属性】
技术研发人员:毛亮郭子豪吴惠粦张兴龙梁志尚
申请(专利权)人:广州国家现代农业产业科技创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1