一种番茄茎秆图像标注质量定量分析方法技术

技术编号:38721078 阅读:10 留言:0更新日期:2023-09-08 23:16
本发明专利技术公开了一种番茄茎秆图像标注质量定量分析方法,以解决如何定量分析番茄茎秆图像标注质量这一技术问题。首先,随机选取2个图像标注人对10幅图像进行2次重复标注;然后,计算同一图像2次标注结果间的像素混淆矩阵;接着分别计算同一图像同一标注人2次标注结果间的Kappa值,同一图像2个标注人2次标注结果间的Kappa值;最后,基于Kappa值实现番茄茎秆图像标注质量的定量分析。应用本发明专利技术可实现单个图像标注人图像标注质量的定量分析,同时也可实现多个图像标注人整体图像标注质量的定量分析,从而可为图像标注质量分析与控制提供量化依据,为图像标注质量改进指明方向。为图像标注质量改进指明方向。为图像标注质量改进指明方向。

【技术实现步骤摘要】
一种番茄茎秆图像标注质量定量分析方法


[0001]本专利技术属于图像标注及质量分析的
,涉及一种番茄茎秆图像标注质量定量分析方法。

技术介绍

[0002]为实现番茄种植过程中的自动剪枝,自动采摘,需实现番茄植株茎秆的自动识别。基于深度学习模型实现番茄植株茎秆识别具有识别正确率高的优点。对番茄植株茎秆深度学习识别模型进行训练时,需首先对番茄植株茎秆进行图像标注。
[0003]随着深度学习模型应用的日益拓展,对图像数据集进行图像标注的需求也日益增多,专门提供图像标注服务的众包平台因此得到了快速发展。众包平台的发展为大规模图像标注数据的获取提供了便利,但由于个体图像标注人之间存在图像标注差异,单个图像标注人所提供的图像标注质量水平具有一定的随机性,从而影响了基于该图像标注结果进行深度学习模型训练的质量,进而影响了深度学习模型的性能。因此,对众包公司和其他参与图像标注任务的人员而言,图像标注质量的分析问题已成为当前深度学习领域必须要解决的一个重要问题。
[0004]当前常见的一种图像标注质量分析方法是基于众包平台的多标签聚合方法。该方法通过聚合多个图像标注人对同一图像的标注结果,以得到更准确和一致的标签。该方法利用统计模型、机器学习算法或者人工设计的规则可实现图像标签的聚合和决策,以提升图像标注质量,但该方法无法实现图像标注质量的定量分析。另一种图像标注质量分析方法是以专家标注或者众包平台中高质量标注人的标注结果为参考,通过与专家标注或者高质量标注人的标注结果进行对比,可评估其他标注人图像标注质量。该方法可通过比较实现图像标注质量的定性分析,但无法实现图像标注质量的定量分析,且无法对单个标注人内部的图像标注质量进行定量分析,同样无法对多个标注人之间的整体图像标注质量进行定量分析。然而,对单个标注人进行内部图像标注质量分析,以及对多个标注人之间整体图像标注质量进行分析,即分析单个标注人多次图像标注结果间的图像标注质量波动,以及分析多个标注人图像标注结果之间的图像标注质量波动,明确每个标注人图像标注质量水平,以及多个标注人整体图像标注质量水平,对实现图像标注质量分析与控制,指明图像标注质量改进方向非常重要。
[0005]综上,非常需要一种番茄茎秆图像标注质量定量分析方法,以确保番茄茎秆图像标注质量。本专利技术可实现单个图像标注人图像标注质量的定量分析,同时也可实现多个图像标注人整体图像标注质量的定量分析,从而可为图像标注质量分析与控制提供量化依据,为图像标注质量改进指明方向,对提高图像标注质量非常重要。高质量的图像标注,也为获得高质量的番茄茎秆深度学习模型提供了可能。

技术实现思路

[0006]本专利技术的目的在于提供了一种番茄茎秆图像标注质量定量分析方法,以实现番茄
茎秆图像标注质量的定量分析。
[0007]本专利技术采用的技术方案是:
[0008]一种番茄茎秆图像标注质量定量分析方法,包含以下步骤:
[0009]①
标注人选择:从参与图像标注的所有标注人中随机选出两名标注人A、B;
[0010]②
标注规则制定:按照被标注对象的标注要求,制定图像标注规则;
[0011]③
第一次标注图像数据集构建:从被标注图像数据集中选出10幅图像;
[0012]④
第一次图像标注:让标注人A、B对所选的10幅图像按照标注规则进行标注;
[0013]⑤
第二次标注图像数据集构建:将已标注的10幅图像做好标记分别放回分配给标注人A、B的图像数据集中,并将图像数据集中所有图像标注顺序随机化;
[0014]⑥
第二次图像标注:标注人A、B按标注规则对图像数据集中的所有图像按标注顺序进行标注;
[0015]⑦
图像标注质量分析数据集构建:标注结束后将做过标记的10幅图像从图像数据集中取出,并将其和之前标注的10幅图像一起作为图像标注质量分析数据集;
[0016]⑧
同一图像两次标注结果间的像素混淆矩阵计算:计算两次图像标注结果均标注为番茄茎秆的像素数记为真阳数TP;计算两次图像标注结果均标注为非番茄茎秆的像素数记为真阴数TN;计算第一次图像标注结果标注为番茄茎秆而第二次图像标注结果标注为非番茄茎秆的像素数记为假阳数FP;计算第一次图像标注结果标注为非番茄茎秆而第二次图像标注结果标注为番茄茎秆的像素数记为假阴数FN;真阳数TP,真阴数TN,假阳数FP,假阴数FN构成像素混淆矩阵;
[0017]⑨
Kappa值计算:Kappa计算如式(1)所示:式中:P
o
表示观察一致数;P
e
表示期望一致数;P
o
、P
e
的计算分别如式(2)(3)所示:的计算分别如式(2)(3)所示:
[0018]⑩
番茄茎秆图像标注质量定量分析:根据Kappa值定量分析番茄茎秆图像标注质量,Kappa值越大,番茄茎秆图像标注质量越高,Kappa值越小,番茄茎秆图像标注质量越低。
[0019]所述的标注规则制定,包括如下规则:仅标注清晰的番茄茎秆,对于不清晰的番茄茎秆不做标注;仅标注番茄茎秆的主茎秆及其侧枝,对被枝叶或其他障碍物遮挡的番茄茎秆部分不做标注。
[0020]所述的第一次图像标注和第二次图像标注,其要求如下:图像标注时,两名标注人之间不进行有关图像标注内容的沟通,分别对被标注图像按照制定的标注规则进行独立标注;第一次图像标注和第二次图像标注之间间隔的时间需足够长,确保两名标注人已遗忘前一次的图像标注结果。
[0021]所述的第二次图像标注,具体要求为:标注人A、B对图像数据集中的所有图像进行标注期间未知所标注的图像数据集中哪些是已经过第一次标注的10幅图像。
[0022]所述的同一图像两次标注结果间的像素混淆矩阵计算,其要求是:求两次图像标
注结果的并集;采用膨胀这一数学形态学图像处理方法将两次图像标注结果并集中茎秆区域膨胀向外扩展10个像素宽度;将膨胀处理后的茎秆区域作为统计两次标注结果间像素混淆矩阵中的真阳数TP,真阴数TN,假阳数FP,假阴数FN的统计范围。
[0023]所述的同一图像两次标注结果间的像素混淆矩阵计算,包括:每个标注人两次图像标注结果间的像素混淆矩阵计算,得到标注人A的两次图像标注结果间的像素混淆矩阵A,标注人B的两次图像标注结果间的像素混淆矩阵B;两个标注人之间两次图像标注结果间的像素混淆矩阵计算,通过将每个标注人两次图像标注结果求并集作为该标注人的图像标注结果,进而计算获得两个标注人图像标注结果间的像素混淆矩阵AB。
[0024]所述的Kappa值计算,包括:对标注人A的两次图像标注结果间的像素混淆矩阵A,标注人B的两次图像标注结果间的像素混淆矩阵B,以及两个标注人图像标注结果间的像素混淆矩阵AB分别计算获得标注人A的两次图像标注结果间的Kappa值K
A
,标注人B的两次图像标注结果间的Kappa值K
B
,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种番茄茎秆图像标注质量定量分析方法,其特征在于,包括以下步骤:

标注人选择:从参与图像标注的所有标注人中随机选出两名标注人A、B;

标注规则制定:按照被标注对象的标注要求,制定图像标注规则;

第一次标注图像数据集构建:从被标注图像数据集中选出10幅图像;

第一次图像标注:让标注人A、B对所选的10幅图像按照标注规则进行标注;

第二次标注图像数据集构建:将已标注的10幅图像做好标记分别放回分配给标注人A、B的图像数据集中,并将图像数据集中所有图像标注顺序随机化;

第二次图像标注:标注人A、B按标注规则对图像数据集中的所有图像按标注顺序进行标注;

图像标注质量分析数据集构建:标注结束后将做过标记的10幅图像从图像数据集中取出,并将其和之前标注的10幅图像一起作为图像标注质量分析数据集;

同一图像两次标注结果间的像素混淆矩阵计算:计算两次图像标注结果均标注为番茄茎秆的像素数记为真阳数TP;计算两次图像标注结果均标注为非番茄茎秆的像素数记为真阴数TN;计算第一次图像标注结果标注为番茄茎秆而第二次图像标注结果标注为非番茄茎秆的像素数记为假阳数FP;计算第一次图像标注结果标注为非番茄茎秆而第二次图像标注结果标注为番茄茎秆的像素数记为假阴数FN;真阳数TP,真阴数TN,假阳数FP,假阴数FN构成像素混淆矩阵;

Kappa值计算:Kappa计算如式(1)所示:式中:P
o
表示观察一致数;P
e
表示期望一致数;P
o
、P
e
的计算分别如式(2)(3)所示:的计算分别如式(2)(3)所示:

番茄茎秆图像标注质量定量分析:根据Kappa值定量分析番茄茎秆图像标注质量,Kappa值越大,番茄茎秆图像标注质量越高,Kappa值越小,番茄茎秆图像标注质量越低。2.根据权利要求1所述的一种番茄茎秆图像标注质量定量分析方法,其特征在于:所述的标注规则制定,包括如下规则:仅标注清晰的番茄茎秆,对于不清晰的番茄茎秆不做标注;仅标注番茄茎秆的主茎秆及其侧枝,对被枝叶或其他障碍物遮挡的番茄茎秆部分不做标注。3.根据权利要求1所述的一种番茄茎秆图像标注质量定量分析方法,其特征在于:所述的第一次图像标注和第二次图像标注,其要求如下:图像标注时,两名标注人之间不进行有关图像标注内容的沟通,分别对被标注图像按照制定的标注规则进行独立标注;第一次图像标注和第二次图像标注之间间隔的时间...

【专利技术属性】
技术研发人员:项荣袁欣宇
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1