一种基于深度学习的图像目标检测方法技术

技术编号：40065342 阅读：6 留言：0更新日期：2024-01-16 23:20

本发明专利技术属于计算机视觉领域，具体涉及一种基于深度学习的图像目标检测方法，包括：获取待检测图像，对待检测图像进行预处理；将预处理后的图像输入到的训练后的目标检测模型中，得到目标检测结果；所述目标检测模型为改进的Yolov5网络结构；改进的Yolov5网络包括：通过Kmeans++聚类算法和遗传算法对Yolov5网络中的锚框进行更新，对Yolov5网络预测层进行优化；本发明专利技术采用K‑means++算法和遗传算法对Yolov5网络中的锚框进行优化更新，使得Yolov5网络能够面对更加细小的目标进行检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉领域，具体涉及一种基于深度学习的图像目标检测方法。

技术介绍

1、近年来，目标检测作为计算机视觉的一个重要分支在多个领域发挥了巨大作用。在现实场景中，由于存在大量的小目标，因此小目标检测在医疗、智能交通、智慧零售、安防刑侦以及国防安全等领域具备广泛的应用前景。在目标检测任务中目标检测的精度对事件触发起到至关重要的作用，但小目标的检测精度还不能令人满意，成为业界的一大难点。而yolov5网络是目标检测中的常用网络，其由于速度快、模型小、准确率高而常被应用于各种目标检测任务。但在菊花疏蕾任务中，菊花的花蕾在图像中常常很小，在目标检测任务中属于小目标，但是传统的yolov5网络检测小目标精准度不高，导致检测结果不理想。

技术实现思路

1、为解决以上现有技术存在的问题，本专利技术提出了一种基于深度学习的图像目标检测方法，该方法包括：获取待检测图像，对待检测图像进行预处理；将预处理后的图像输入到的训练后的目标检测模型中，得到目标检测结果；所述目标检测模型为改进的yolov5网络结构；改进的yolov5网络包括：通过kmeans++聚类算法和遗传算法对yolov5网络中的锚框进行更新，对yolov5网络预测层进行优化；

2、对目标检测模型进行训练的过程包括：

3、s1：获取图像数据集；

4、s2：对图像数据集中的图像数据进行标注，并对标注后的数据进行预处理；

5、s3：将预处理后的图像输入到改进的yolov5网络中，得到目标检测结果；

6、s4：根据目标检测结果计算模型的损失函数；

7、s5：调整模型的参数进行优化，当损失函数收敛时完成模型的训练。

8、优选的，待检测图像的像素为1920*1080。

9、优选的，对图像进行预处理包括：对图像进行仿射变换和添加高斯噪声；其中仿射变换包括对目标图像矩阵进行缩放、平移、旋转、拉伸、收缩等操作。

10、优选的，采用改进的yolov5网络对图像进行处理包括：

11、步骤1：调整图像大小，对图像进行缩放操作，得到大小为416*416像素的图像；

12、步骤2：对调整后的图像进行归一化处理；

13、步骤3：对归一化后的图像转换颜色空间，即将图像从rgb颜色空间转换为hsv颜色空间；rgb颜色空间转换hsv颜色空间公式如下：

14、

15、

16、

17、cmax＝max(r′,g′,b′)

18、gmin＝min(r',g',b')

19、δ＝cmax-cmin

20、

21、

22、v(value)＝cmax

23、其中，r表示红色通道，g为绿色通道，b为蓝色通道，r′为归一化后的红色通道，g′为归一化后的绿色通道，b′为归一化后的蓝色通道，cmax为归一化后rgb通道最大值，cmin为归一化后rgb通道最小值，δ为rgb通道最大值与最小值的差值，h为色调，s为饱和度，v为明度；

24、步骤4：将预处理后的图像转换成yolov5网络的输入张量格式，将图像数据转换成一个固定大小的张量，并对张量中的数据进行排列；张量的格式为[batch_size,channels,height,width]，其中batch_size表示批量大小，channels表示通道数，height和width分别表示图像的高度和宽度。

25、进一步的，对yolov5网络中的锚框进行更新包括：获取yolov5网络中的锚框；采用k-means++算法对锚框进行聚类；采用遗传算法对聚类结果进行优化，得到最优的锚框。

26、进一步的，采用k-means++算法对锚框进行聚类包括：

27、步骤1：将所有的锚框进行集合，从集合中随机选取一个样本作为第一聚类中心；

28、步骤2：计算集合中样本xi到聚类中心的交并比iou，将样本xi与已有聚类中心的距离1-iou标记为d(x)；

29、步骤3：根据d(x)计算每个点成为聚类中心的概率为p(x)；

30、步骤4：对所有的概率值进行筛选，将概率值最高的点作为下一个聚类中心；

31、步骤5：重复步骤2～步骤4，直到聚类中心位置不发生变化，则输出聚类后的锚框。

32、进一步的，计算集合中样本xi到聚类中心的交并比iou的公式为：

33、

34、其中，a为预测框，b为真实框，∩为求交运算，∪为求并运算。

35、进一步的，采用遗传算法对聚类结果进行优化包括：

36、步骤1：定义适应度函数，其中适应度函数为预测框与真实框之间的平均iou值；适应度函数表达式为：

37、fitness＝average(iou)

38、步骤2：初始化种群，种群中包含多个个体，每个个体由一组锚框大小和宽高比组成；

39、步骤3：对种群进行选择操作，选择操作公式如下：

40、

41、其中，p(i)表示第i个个体被选中的概率，fitness(i)表示第i个个体的适应度值，∑fitness(j)表示所有个体的适应度值之和；

42、步骤4：对选择后操作后的种群进行交叉操作，生成新的个体；交叉操作的表达式为：

43、i＝i1[:k]+i2[k:]

44、其中，k表示交叉点的位置，i1和i2分别表示两个被选中的个体，i表示生成的新个体；

45、步骤5：对新个体进行变异操作；

46、步骤6：在交叉和变异操作之后对新生成的个体进行适应度评估；

47、步骤7：根据适应度函数评估每个个体的优劣程度，选择一部分个体作为下一代种群的父代；

48、步骤8：重复进行步骤3-步骤7，直到经过多次迭代后种群的个体适应度不再改变。

49、优选的，采用预测层对目标进行检测的过程包括：

50、步骤1：前向传播：将经过预处理的图像输入到yolov5网络中进行前向传播，得到网络的输出特征图；

51、步骤2：采用小目标检测头对特征图进行处理，得到小目标特征图；

52、步骤3：预测框生成：对小目标特征图进行解码，得到包含预测框坐标、类别概率和置信度的特征向量；对特征向量进行后处理，并采用非极大值抑制算法去除重叠的预测框，并对置信度较低的预测框进行过滤；将预测框转换为实际坐标。

53、优选的，模型的损失函数表达式为：

54、

55、其中，iou表示预测框和真实框之间交并比的差值，α是权重函数，v用来度量长宽比的相似性。

56、本专利技术的有益效果：

57、本专利技术采用k-means++算法和遗传算法对yolov5网络中的锚框进行优化更新，使得yolov5网络能够面对更加细小的目标进行检测；本专利技术本文档来自技高网...

【技术保护点】

1.一种基于深度学习的图像目标检测方法，其特征在于，包括：获取待检测图像，对待检测图像进行预处理；将预处理后的图像输入到的训练后的目标检测模型中，得到目标检测结果；所述目标检测模型为改进的Yolov5网络结构；改进的Yolov5网络包括：通过Kmeans++聚类算法和遗传算法对Yolov5网络中的锚框进行更新，对Yolov5网络预测层进行优化；

2.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，待检测图像的像素为1920*1080。

3.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，对图像进行预处理包括：对图像进行仿射变换和添加高斯噪声；其中仿射变换包括对目标图像矩阵进行缩放、平移、旋转、拉伸、收缩等操作。

4.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，采用改进的Yolov5网络对图像进行处理包括：

5.根据权利要求4所述的一种基于深度学习的图像目标检测方法，其特征在于，对Yolov5网络中的锚框进行更新包括：获取Yolov5网络中的锚框；采用K-means++算

6.根据权利要求5所述的一种基于深度学习的图像目标检测方法，其特征在于，采用K-means++算法对锚框进行聚类包括：

7.根据权利要求6所述的一种基于深度学习的图像目标检测方法，其特征在于，计算集合中样本xi到聚类中心的交并比IOU的公式为：

8.根据权利要求5所述的一种基于深度学习的图像目标检测方法，其特征在于，采用遗传算法对聚类结果进行优化包括：

9.根据权利要求4所述的一种基于深度学习的图像目标检测方法，其特征在于，采用预测层对目标进行检测的过程包括：

10.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，模型的损失函数表达式为：

...

【技术特征摘要】

1.一种基于深度学习的图像目标检测方法，其特征在于，包括：获取待检测图像，对待检测图像进行预处理；将预处理后的图像输入到的训练后的目标检测模型中，得到目标检测结果；所述目标检测模型为改进的yolov5网络结构；改进的yolov5网络包括：通过kmeans++聚类算法和遗传算法对yolov5网络中的锚框进行更新，对yolov5网络预测层进行优化；

2.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，待检测图像的像素为1920*1080。

4.根据权利要求1所述的一种基于深度学习的图像目标检测方法，其特征在于，采用改进的yolov5网络对图像进行处理包括：

5.根据权利要求...

【专利技术属性】
技术研发人员：夏泽昊，李腊全，张桂铭，胡景怡，卢柄材，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人