基于YOLOv5网络模型的目标识别方法及装置制造方法及图纸

技术编号：35296461 阅读：24 留言：0更新日期：2022-10-22 12:43

本发明专利技术公开了一种基于YOLOv5网络模型的目标识别方法及装置，其中所述方法包括：获取待识别的目标图像并输入至YOLOv5算法网络模型中，以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作，识别所述目标图像内所有待识别目标的位置，生成所述目标图像的目标识别结果。本发明专利技术提供的一种基于YOLOv5网络模型的目标识别方法，基于GhostNet为主干网络的同时引入了CA注意力机制，可以减少网络模型的计算开销，使目标检测模型的网络结构更为轻量化，且能够提高对个体较小的待测目标以及大面积团簇重叠的多目标识别精度。积团簇重叠的多目标识别精度。积团簇重叠的多目标识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
基于YOLOv5网络模型的目标识别方法及装置

[0001]本专利技术涉及计算机视觉和深度学习
，特别是涉及一种基于YOLOv5网络模型的目标识别方法及装置。

技术介绍

[0002]近年来，基于深度学习的目标检测方法，直接通过深层卷积网络结构自动学习图像的高阶特征而不需要手动设计特征，在提升对象检测任务的精度的同时还提高了检测效率。这类基于深度学习的目标检测方法一般分为基于候选区域的方法和基于回归的方法。其中基于候选区域的方法主要包括Fast R－CNN、Faster R－CNN和R－CNN，这类方法虽然准确，但计算成本很高，检测速度慢；而基于回归的方法主要包括YOLO和SSD，这类方法具有较好的检测速度和精度，因而得到了广泛的应用。
[0003]YOLOv5算法是一种检测精度高、速度快的检测算法，在开源数据集上有良好的效果。但是在果园荔枝果实数量检测等遮挡目标尤其是小目标检测等场景下存在检测精度不够的问题，现有YOLOv5的网络结构大多采用CSPDarknet53作为主干网络，对图片进行特征提取，其中还包含CBS结构以及C3结构，无法避免因为大量卷积操作造成神经网络的计算开销大的问题。

技术实现思路

[0004]本申请提供了一种基于YOLOv5网络模型的目标识别方法及装置，用于轻量化目标检测模型的同时提高小目标物体检测的精度。
[0005]第一方面，本申请提供了一种基于YOLOv5网络模型的目标识别方法，包括：获取待识别的目标图像；
[0006]将所述目标图像输入至YOL...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOv5网络模型的目标识别方法，其特征在于，包括：获取待识别的目标图像；将所述目标图像输入至YOLOv5算法网络模型中，以使所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作和执行注意力操作，识别所述目标图像内所有待识别目标的位置，生成所述目标图像的目标识别结果；其中，所述YOLOv5算法网络模型中的主干网络在N个预设位置处的Ghost botteneck层后引入CA注意力机制，N为大于等于4的正整数。2.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法，其特征在于，所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行卷积操作，具体包括：对所述主干网络中每一Ghost botteneck层的输入目标图像执行缩略预设倍数卷积通道的卷积操作，生成第一特征图；对所述第一特征图进行卷积操作，生成每一所述Ghost botteneck层对应的目标图像特征图。3.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法，其特征在于，所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作，具体为：对引入CA注意力机制的每个所述Ghost botteneck层执行注意力操作；其中，所述注意力操作包括：使用两个预设尺寸的池化核对Ghost botteneck层对应的目标图像特征图每个通道的水平坐标和垂直坐标进行编码，生成水平方向感知特征图和垂直方向感知特征图；将所述水平方向感知特征图和所述垂直方向感知特征图进行拼接，生成第一特征图；根据预设公式获取所述第一特征图在水平方向和垂直方向的注意力权重，生成注意力权重特征图。4.如权利要求1所述的一种基于YOLOv5网络模型的目标识别方法，其特征在于，所述YOLOv5算法网络模型基于GhostNet为主干网络对所述目标图像执行注意力操作后，还包括：选取所述主干网络中若干个预设位置处的Ghost botteneck层输出四个预设尺寸的目标图像特征图；将所述四个预设尺寸的目标图像特征图进行特征融合，输出对应四个预设尺寸的融合特征图，对所述四个预设尺寸的融合特征图执行剪枝操作。5.如权利要求4所述的一种基于YOLOv5网络模型的目标识别方法，其特征在于，所述对所述四个预设尺寸的融合特征图执行剪枝操作，具体包括：将第一预设尺寸的融合特征图、第二预设尺寸的融合特征图和第三预设尺寸的融合特征图分别输入至检测...

【专利技术属性】
技术研发人员：毛亮，郭子豪，吴惠粦，张兴龙，梁志尚，
申请(专利权)人：广州国家现代农业产业科技创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人