System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、垃圾检测方法及装置制造方法及图纸_技高网

模型训练方法、垃圾检测方法及装置制造方法及图纸

技术编号:40247195 阅读:5 留言:0更新日期:2024-02-02 22:42
本发明专利技术实施例提供了模型训练方法、垃圾检测方法及装置,涉及目标检测技术领域,模型训练方法包括:使用第一训练集对第一模型进行训练;将第二模型的主干网络的网络参数设置为第一模型的主干网络的网络参数;使用第二训练集对第二模型进行训练;将第三模型的主干网络的网络参数设置为第一模型的主干网络的网络参数,将第三模型的颈部网络的网络参数设置为第二模型的颈部网络的网络参数,以及将第三模型的头部网络的网络参数设置为第二模型的头部网络的网络参数;使用第三训练集对第三模型进行训练,以使第三模型识别目标物体类别的准确率达到第三阈值。提高了模型的泛化性能,在训练数据有限的情况下,提升了检测结果的准确性。

【技术实现步骤摘要】

本专利技术涉及目标检测,具体涉及模型训练方法、垃圾检测方法及装置


技术介绍

1、垃圾分类是社会发展的趋势,在铁塔中高点位视频监控场景中,进行垃圾检测可以提高垃圾分类的效率。目前一般基于深度学习的网络模型对图像中的目标物进行检测,而影响网络模型的检测效果的因素包括在对该网络模型进行训练时使用的训练集。

2、然而,现有技术中针对垃圾检测的训练集有限,在中高点位视频监控场景中,针对垃圾检测的训练集更少,导致垃圾检测模型训练效果欠佳,从而导致垃圾检测准确性较差。

3、可见,现有技术中存在垃圾检测模型训练效果欠佳导致垃圾检测准确性较差的问题。


技术实现思路

1、本专利技术实施例提供一种模型训练方法、垃圾检测方法及装置,以解决现有技术中垃圾检测模型训练效果欠佳导致垃圾检测准确性较差的问题。

2、本专利技术实施例提供了一种模型训练方法,所述方法包括:

3、使用第一训练集对第一模型进行训练,以使所述第一模型检测目标物体的准确率达到第一阈值;

4、将第二模型的主干网络的网络参数设置为所述第一模型的主干网络的网络参数;

5、使用第二训练集对所述第二模型进行训练,以使所述第二模型识别目标物体类别的准确率达到第二阈值;

6、将第三模型的主干网络的网络参数设置为所述第一模型的主干网络的网络参数,将所述第三模型的颈部网络的网络参数设置为所述第二模型的颈部网络的网络参数,以及,将所述第三模型的头部网络的网络参数设置为所述第二模型的头部网络的网络参数;

7、使用第三训练集对所述第三模型进行训练,以使所述第三模型识别目标物体类别的准确率达到第三阈值。

8、可选地,在所述使用第二训练集对所述第二模型进行训练之前,所述方法还包括:

9、获取预先采集到的垃圾样本图像;

10、对所述垃圾样本图像进行数据增强处理,得到所述第二训练集。

11、可选地,在所述使用第三训练集对所述第三模型进行训练之前,所述方法还包括:

12、获取预先采集到的预设拍摄点位的垃圾样本图像;

13、对所述预设拍摄点位的垃圾样本图像进行数据增强处理,得到所述第三训练集。

14、可选地,所述数据增强处理包括拼接处理、色度饱和度亮度hsv处理、偏移处理、缩放处理和翻转处理中的至少一种。

15、可选地,所述使用第三训练集对所述第三模型进行训练,以使所述第三模型识别目标物体类别的准确率达到第三阈值,包括:

16、对所述第三模型中颈部网络的网络参数和头部网络的网络参数进行迭代,直至通过所述第三模型中头部网络输出数据的损失函数达到目标阈值,其中,所述损失函数包括置信度损失、分类损失和坐标回归损失。

17、可选地,所述第二训练集和所述第三训练集均包括正样本数据和负样本数据,所述正样本数据包括零散生活垃圾样本图像、建材堆垃圾样本图像和生活垃圾堆样本图像中的至少一种,所述负样本数据包括非垃圾堆放物样本图像、道路坑堆样本图像、垃圾桶样本图像、垃圾箱样本图像、载货车样本图像、垃圾车样本图像、道路井盖样本图像和砖石堆样本图像中的至少一种。

18、本专利技术实施例还提供了一种垃圾检测方法,所述方法包括:

19、对获取的目标图像进行预处理,所述目标图像为从铁塔上预设拍摄点位拍摄的视频中获取的图像,所述预处理包括缩放处理和归一化处理;

20、将所述目标图像输入至预先训练得到的第三模型,生成检测结果;

21、根据所述检测结果进行告警反馈。

22、本专利技术实施例还提供了一种模型训练装置,所述装置包括:

23、第一训练模块,用于使用第一训练集对第一模型进行训练,以使所述第一模型检测目标物体的准确率达到第一阈值;

24、第一设置模块,用于将第二模型的主干网络的网络参数设置为所述第一模型的主干网络的网络参数;

25、第二训练模块,用于使用第二训练集对所述第二模型进行训练,以使所述第二模型识别目标物体类别的准确率达到第二阈值;

26、第二设置模块,用于将第三模型的主干网络的网络参数设置为所述第一模型的主干网络的网络参数,将所述第三模型的颈部网络的网络参数设置为所述第二模型的颈部网络的网络参数,以及,将所述第三模型的头部网络的网络参数设置为所述第二模型的头部网络的网络参数;

27、第三训练模块,用于使用第三训练集对所述第三模型进行训练,以使所述第三模型识别目标物体类别的准确率达到第三阈值。

28、可选地,所述装置还包括:

29、第一获取模块,用于获取预先采集到的垃圾样本图像;

30、第一处理模块,用于对所述垃圾样本图像进行数据增强处理,得到所述第二训练集。

31、可选地,所述装置还包括:

32、第二获取模块,用于获取预先采集到的预设拍摄点位的垃圾样本图像;

33、第二处理模块,用于对所述预设拍摄点位的垃圾样本图像进行数据增强处理,得到所述第三训练集。

34、可选地,所述数据增强处理包括拼接处理、色度饱和度亮度hsv处理、偏移处理、缩放处理和翻转处理中的至少一种。

35、可选地,所述第三训练模块包括:

36、迭代子模块,用于对所述第三模型中颈部网络的网络参数和头部网络的网络参数进行迭代,直至通过所述第三模型中头部网络输出数据的损失函数达到目标阈值,其中,所述损失函数包括置信度损失、分类损失和坐标回归损失。

37、可选地,所述第二训练集和所述第三训练集均包括正样本数据和负样本数据,所述正样本数据包括零散生活垃圾样本图像、建材堆垃圾样本图像和生活垃圾堆样本图像中的至少一种,所述负样本数据包括非垃圾堆放物样本图像、道路坑堆样本图像、垃圾桶样本图像、垃圾箱样本图像、载货车样本图像、垃圾车样本图像、道路井盖样本图像和砖石堆样本图像中的至少一种。

38、本专利技术实施例还提供了一种垃圾检测装置,所述装置包括:

39、预处理模块,用于对获取的目标图像进行预处理,所述目标图像为从铁塔上预设拍摄点位拍摄的视频中获取的图像,所述预处理包括缩放处理和归一化处理;

40、生成模块,用于将所述目标图像输入至预先训练得到的第三模型,生成检测结果;

41、反馈模块,用于根据所述检测结果进行告警反馈。

42、本专利技术实施例中,在模型训练过程中采用了多级迁移学习技术,首先借助通用场景中大批量的第一训练集预训练第一模型的特征提取能力,然后将训练好的第一模型中主干网络的网络参数迁移至第二模型的主干网络,并基于某个特定场景中中批量的第二训练集训练第二模型的特征识别能力,然后将训练好的第一模型中主干网络的网络参数迁移至第三模型的主干网络,以及将练好的第二模型中颈部网络和头部网络对应的网络参数迁移至第三模型的颈部网络和头部网络,并基于当前特定场景中特定视角的小批量的第三训练集训练第三模本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述使用第二训练集对所述第二模型进行训练之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在所述使用第三训练集对所述第三模型进行训练之前,所述方法还包括:

4.根据权利要求2或3中任一项所述的方法,其特征在于,所述数据增强处理包括拼接处理、色度饱和度亮度HSV处理、偏移处理、缩放处理和翻转处理中的至少一种。

5.根据权利要求1所述的方法,其特征在于,所述使用第三训练集对所述第三模型进行训练,以使所述第三模型识别目标物体类别的准确率达到第三阈值,包括:

6.根据权利要求1所述的方法,其特征在于,所述第二训练集和所述第三训练集均包括正样本数据和负样本数据,所述正样本数据包括零散生活垃圾样本图像、建材堆垃圾样本图像和生活垃圾堆样本图像中的至少一种,所述负样本数据包括非垃圾堆放物样本图像、道路坑堆样本图像、垃圾桶样本图像、垃圾箱样本图像、载货车样本图像、垃圾车样本图像、道路井盖样本图像和砖石堆样本图像中的至少一种。>

7.一种垃圾检测方法,其特征在于,所述方法包括:

8.一种模型训练装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述装置还包括:

10.根据权利要求8所述的装置,其特征在于,所述装置还包括:

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述使用第二训练集对所述第二模型进行训练之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在所述使用第三训练集对所述第三模型进行训练之前,所述方法还包括:

4.根据权利要求2或3中任一项所述的方法,其特征在于,所述数据增强处理包括拼接处理、色度饱和度亮度hsv处理、偏移处理、缩放处理和翻转处理中的至少一种。

5.根据权利要求1所述的方法,其特征在于,所述使用第三训练集对所述第三模型进行训练,以使所述第三模型识别目标物体类别的准确率达到第三阈值,包括:

6....

【专利技术属性】
技术研发人员:曹润东余家忠刘子伟梁清华靳志娟李飞刘昱含
申请(专利权)人:中国铁塔股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1