System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据标注框修正方法技术_技高网

数据标注框修正方法技术

技术编号:40954455 阅读:12 留言:0更新日期:2024-04-18 20:30
本申请公开一种数据标注框修正方法,其包括:将待修正标注的数据集划分为训练集和测试集,其中,训练集和测试集的每一样本图像中均包括多个目标的原始的标注框;利用初始的目标检测模型对训练集进行推理检测,获得训练集的每一样本图像的多个目标的预测框集合;设定包含多个参考阈值的阈值集合;以及根据参考阈值及每一样本图像的标注框和该样本图像的预测框之间的交并比值多次循环修正初始的目标检测模型以及训练集中的该样本图像中的标注框。

【技术实现步骤摘要】

本申请涉及数字图像处理,更具体地说,涉及一种数据标注框修正方法


技术介绍

1、影响学习模型精度的因素有很多,比如网络自身的能力受限,学习迭代次数不够,训练数据不够等。但通常来说,数据的标注质量对训练出来的模型精度影响更大也更直接,因为数据标注直接参与指导模型学习,是模型拟合的目标,若数据标注含有过多噪声,对指导模型训练反而有害。所以如何保证数据标注质量是如今算法工程师首先要考虑的问题。最简单的方法就是人工复核一遍数据标注,对于少量数据集或许工作量不大,但一旦数据量上升到十万甚至千万,那人工复核显然不便捷也不太现实。


技术实现思路

1、针对现有技术,本申请解决的技术问题是提供一种降低人工复核带来的不便捷的数据标注框修正方法。

2、为解决上述技术问题,本申请提供一种数据标注框修正方法,其包括:

3、将待修正标注的数据集划分为训练集和测试集,其中,训练集和测试集的每一样本图像中均包括多个目标的原始的标注框;

4、利用初始的目标检测模型对训练集进行推理检测,获得训练集的每一样本图像的多个目标的预测框集合;

5、设定包含多个参考阈值的阈值集合;以及

6、根据阈值集合以及每一样本图像的标注框和该样本图像的预测框之间的交并比值多次循环修正初始的目标检测模型以及训练集中的该样本图像中的标注框。

7、在所述数据标注框修正方法中,相对于人工复核标注框,该数据标注框修正方法通过目标检测模型和设定阈值形成自动对训练集中的标注框进行复核修正,相对于人工复核而言可适应大量数据集的标注框的复核修正,并且并且更加便捷。

8、在一种可能的实现方式中,设定包含多个参考阈值的阈值集合为阈值集合t,t={t1,t2,t3,…,tq};

9、其中,t1,t2,t3,…,tq依次为第一个参考阈值、第二个参考阈值、第三个参考阈值,…,第q个参考阈值并且1>t1>t2>t3…>tq>0。

10、在一种可能的实现方式中,根据阈值集合以及每一样本图像f的标注框和预测框之间的交并比值多次循环修正初始的目标检测模型以及训练集中的该样本图像f中的标注框,包括:

11、选定参考阈值ti为当前参考阈值t,其中i=1;

12、将由初始的目标检测模型mod1对样本图像f进行目标检测而获得的预测框作为当前预测框集合pd,将样本图像f的初始待修正的多个目标的标注框形成的标注框集合m1作为当前标注框集合md;

13、匹配当前预测框集合pd和当前标注框集合md:对于当前标注框集合md中每一标注框mdj,在当前预测框集合pd中计算出与该标注框mdj的最相匹配的预测框pdmax;

14、修正当前标注框集合md:依据最相匹配的预测框pdmax和标注框mdi之间的交并比值以及当前参考阈值t来修正当前标注框集合md,获得标注框修正集合mdr;

15、修正当前目标检测模型modd:以标注框修正集合mdr和测试集重新训练微调当前目标检测模型modd,获得目标检测修正模型moddr;

16、更新当前参考阈值、当前标注框集合和当前预测集合:将i值更新为i=i+1,更新ti为当前参考阈值t,并将标注框修正集合mdr作为当前标注框集合pd,将由目标检测修正模型moddr作为当前目标检测模型modd并由当前目标检测模型modd对样本图像f进行目标检测以获得新的当前预测框集合pd;

17、并循环持续执行所述匹配当前预测框集合pd和当前标注框集合md的步骤、所述修正当前标注框集合md的步骤、所述修正当前目标检测模型modd的步骤以及所述更新当前参考阈值、当前标注框集合和当前预测框集合,直至i大于p。

18、在一种可能的实现方式中,在前预测框集合pd中计算出与该标注框mdj最相匹配的预测框pdmax,包括:

19、记当前预测框集合pd:pd={pd1,pd2,pd3,…,pdm};

20、计算当前预测框集合pd中每一预测框与该标注框mdj的交并比,获得交并比集合ij={ij1,ij2,ij3,…,ijm};

21、从交并比集合ij中挑选出最大值imax,由最大值imax对应的预测框作为该标注框mdj的最相匹配的预测框pdmax;

22、其中,ij1,ij2,ij3,…,ijm分别表示预测框pd1,pd2,pd3,…,pdm和标注框mdj的交并比值。

23、在一种可能的实现方式中,在修正当前标注框集合md的步骤中:

24、若是,标注框mdj与其对应的预测框pdmax的交并比的值大于当前参考阈值t,则由预测框pdmax替换当前标注框集合pd中的标注框mdj并将预测框pdmax在当前预测框集合pd中剔除掉;

25、否则,将标注框mdj在当前标注框集合md中剔除掉并将标注框mdj在样本图像f中对应框选区域的像素值置零。

26、在一种可能的实现方式中,在当前参考阈值t不为tp时,并在当前标注框集合md中每一标注框均完成修正之后,修正当前标注框集合md还包括:

27、若是当前预测框集合pd中还剩余有检测框未作为当前标注框集合md的任一标注框的预测框pdmax,则将剩余的预测框在样本图像f中对应框选区域的像素值置零。

28、在一种可能的实现方式中,在当前参考阈值t为tp时,并在当前标注框集合md中每一标注框均完成修正之后,修正当前标注框集合md的步骤还包括:

29、若是当前预测框集合pd中还剩余有检测框未作为当前标注框集合md的任一标注框的预测框pdmax,依据剩余的预测框的类别概率是否大于设定的概率阈值判定是否将剩余的预测框加入当前标注框集合中。

30、在一种可能的实现方式中,以标注框修正集合mdr和测试集重新训练微调当前目标检测模型modd,获得目标检测修正模型moddr,包括:

31、以标注框修正集合mdr重新训练当前目标检测模型modd;

32、在每一次过程中,以目标检测评估指标评价每次训练的模型性能,直至当前目标检测模型modd的模型性能达至性能指标阈值时停止训练,获得目标检测修正模型moddr。

33、在一种可能的实现方式中,所述目标检测评估指标基于map指标,设定性能指标阈值取值范围为0.85至0.9。

34、在一种可能的实现方式中,t1取值范围0.8至0.9,并且相邻两个参考阈值之间相差0.1或者0.05。

本文档来自技高网...

【技术保护点】

1.一种数据标注框修正方法,其特征在于,包括:

2.如权利要求1所述的数据标注框修正方法,其特征在于,设定包含多个参考阈值的阈值集合为阈值集合T,T={T1,T2,T3,…,Tq};

3.如权利要求2所述的数据标注框修正方法,其特征在于,其中,根据阈值集合以及每一样本图像F的标注框和预测框之间的交并比值多次循环修正初始的目标检测模型以及训练集中的该样本图像F中的标注框,包括:

4.如权利要求3所述的数据标注框修正方法,其特征在于,在前预测框集合PD中计算出与该标注框MDj最相匹配的预测框PDmax,包括:

5.如权利要求4所述的数据标注框修正方法,其特征在于,在修正当前标注框集合MD的步骤中:

6.如权利要求5所述的数据标注框修正方法,其特征在于,在当前参考阈值t不为Tp时,并在当前标注框集合MD中每一标注框均完成修正之后,修正当前标注框集合MD的步骤还包括:

7.如权利要求5所述的数据标注框修正方法,其特征在于,在当前参考阈值t为Tp时,并在当前标注框集合MD中每一标注框均完成修正之后,修正当前标注框集合MD还包括:

8.如权利要求3所述的数据标注框修正方法,其特征在于,以标注框修正集合MDr和测试集重新训练微调当前目标检测模型ModD,获得目标检测修正模型ModDr,包括:

9.如权利要求8所述的数据标注框修正方法,其特征在于,所述目标检测评估指标基于mAP指标,设定性能指标阈值取值范围为0.85至0.9。

10.如权利要求2至9任一项所述的数据标注框修正方法,其特征在于,T1取值范围0.8至0.9,并且相邻两个参考阈值之间相差0.1或者0.05。

...

【技术特征摘要】

1.一种数据标注框修正方法,其特征在于,包括:

2.如权利要求1所述的数据标注框修正方法,其特征在于,设定包含多个参考阈值的阈值集合为阈值集合t,t={t1,t2,t3,…,tq};

3.如权利要求2所述的数据标注框修正方法,其特征在于,其中,根据阈值集合以及每一样本图像f的标注框和预测框之间的交并比值多次循环修正初始的目标检测模型以及训练集中的该样本图像f中的标注框,包括:

4.如权利要求3所述的数据标注框修正方法,其特征在于,在前预测框集合pd中计算出与该标注框mdj最相匹配的预测框pdmax,包括:

5.如权利要求4所述的数据标注框修正方法,其特征在于,在修正当前标注框集合md的步骤中:

6.如权利要求5所述的数据标注框修正方法,其特征在于,在当前参考阈值t不为tp时...

【专利技术属性】
技术研发人员:李山路欧阳一村罗富章胡玲静彭锦文
申请(专利权)人:盛视科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1