本申请公开了一种辅助检测图像标注质量的方法及装置,所述方法包括:获取待抽检的多个图像;对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;获取所述多个图像的边缘标注数据;基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。所述方法及装置,可以在降低抽样数量以降低检测工作量的同时,获得更好、更稳定的检测效果。
A method and device for auxiliary detection of image annotation quality
【技术实现步骤摘要】
一种辅助检测图像标注质量的方法及装置
本申请涉及计算机
,尤其涉及一种辅助检测图像标注质量的方法及装置。
技术介绍
机器学习结果的优劣,深受训练数据(如样本图像)的标注质量的影响。为了保证训练数据的标注质量,需要对训练数据的标注结果进行质检。目前,通过随机抽样的方式对训练数据的标注质量进行检测。随机抽样的检测效果取决于抽样比例,如果抽样比例较小可能会导致检测效果不稳定,例如,出现同一批数据第一次随机抽样检测不合格,第二次抽样检测却为合格的相反结果。抽样比例越高,检测效果越好,但抽样比例提高时,需要抽检的数据变多,导致检测工作量增大。
技术实现思路
本申请实施例提供一种辅助检测图像标注质量的方法及装置,以实现通过较少的检测工作量获得较好的检测效果的目的。第一方面,本申请实施例提供一种辅助检测图像标注质量的方法,所述方法包括:获取待抽检的多个图像;对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;获取所述多个图像的边缘标注数据;基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。第二方面,本申请实施例还提供一种辅助检测图像标注质量的装置,所述装置包括:图像获取模块,用于获取待抽检的多个图像;边缘检测模块,用于对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;标注数据获取模块,用于获取所述多个图像的边缘标注数据;标注质量评估模块,用于基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;待检图像抽取模块,用于基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。第三方面,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。本申请实施例采用的上述至少一个技术方案,由于可以先基于在待抽检的多个图像中检测出的边缘线和这多个图像的边缘标注数据,确定出这多个图像的标注质量评估参数,然后基于这多个图像的标注质量评估参数,从这多个图像中抽取待检图像,而不是随机的从这多个图像中抽取待检图像。因此,可以在降低抽样数量以降低检测工作量的同时,获得更好、更稳定的检测效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请实施例提供的辅助检测图像标注质量的方法的流程示意图。图2是图1所示方法中的步骤104的详细流程示意图之一。图3是实现图2所示步骤202的原理示意图。图4是实现图2所示步骤202的详细原理示意图。图5是图1所示方法中的步骤104的详细流程示意图之二。图6是实现图5所示步骤502的详细原理示意图。图7是本申请实施例提供的辅助检测图像标注质量的装置的结构示意图。图8是图7所述装置中标注质量评估模块704详细结构示意图之一。图9是图7所述装置中标注质量评估模块704详细结构示意图之二。图10为本申请实施例提供的一种电子设备1000的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了解决现有的图像标注质量检测方法不能以较少的检测工作量获得较好的检测效果的问题,本申请实施例提供了一种辅助检测图像标注质量的方法和装置,该方法的执行主体,可以包括但不限于个人电脑(PersonalComputer,PC)、手机、IPAD、平板电脑、可穿戴设备等能够被配置为执行本申请实施例提供的方法的终端的至少一种,或者,该方法的执行主体,还可以是能够执行该方法的客户端本身。下面先对本申请实施例提供的一种辅助检测图像标注质量的方法进行说明。如图1所示,本申请实施例提供的一种辅助检测图像标注质量的方法,该方法可以包括如下步骤:步骤101、获取待抽检的多个图像。待抽检的多个图像可以是已完成标注且需要质检的一批图像。在一个例子中,这多个图像具体可以是已完成物体边缘标注且需要质检的图像,这多个图像的边缘标注工作可以是人工完成的,也可以是借助一定的自动化手段自动完成的。这多个图像可以存储在指定的存储位置,步骤101可以从该存储位置读取这些图像。步骤102、对所述多个图像进行边缘检测,确定所述多个图像中的边缘线。在实际应用中,可以采用相关技术已有的边缘检测算法,如Sobel算法、Laplacian算法、Canny算法等算法中的任意一种;或者,可以采用未来出现的新的边缘检测算法,确定或提取所述多个图像中的边缘线。其中,应用边缘检测算法对这多个图像进行边缘提取时所采用的阈值可以根据经验设定,也可以根据一定的规则不断优化得到。本说明书会在下文中对该阈值以及本说明书中述及的其他阈值的优化方式进行统一说明,此处暂不赘述。并且,为方便与本说明书中述及的其他阈值区分,可将边缘检测算法采用的阈值称为第一阈值。可选地,在对步骤101中获取的多个图像执行步骤102之前,图1所示的辅助检测图像标注质量的方法,还可以包括:对这多个图像进行高斯模糊处理,以减少图像中的噪点对检测结果的不良影响。具体可以应用相关技术已有的或未来出现的新的高斯模糊算法,对这多个图像进行高斯模糊处理。其中,应用高斯模糊算法对这多个图像进行模糊处理时所采用的阈值可以根据经验设定,也可以根据一定的规则不断优化得到(具体优化方式参见下文)。并且,为方便与本说明书中述及的其他阈值区分,可将高斯模糊算法采用的阈值称为第二阈值。步骤103、获取所述多个图像的边缘标注数据。顾名思义,图像的边缘标注数据即为标注该图像中的物体边缘的数据。作为一个例子,一个图像的边缘标注数据,可以是用于勾勒该图像中的物体边缘的散点。具体的,可以是这些散点在该图像中的坐标。作为另一个例子,一个图像的边缘标注数据,可以是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。具体的,可以是这些多边形的顶点的坐标集合。步骤104、基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数。示例性地,图像的标注质量评估本文档来自技高网...
【技术保护点】
1.一种辅助检测图像标注质量的方法,其特征在于,所述方法包括:/n获取待抽检的多个图像;/n对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;/n获取所述多个图像的边缘标注数据;/n基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;/n基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。/n
【技术特征摘要】
1.一种辅助检测图像标注质量的方法,其特征在于,所述方法包括:
获取待抽检的多个图像;
对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;
获取所述多个图像的边缘标注数据;
基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;
基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。
2.根据权利要求1所述的方法,其特征在于,在所述对所述多个图像进行边缘检测,确定所述多个图像中的边缘线之前,所述方法还包括:
对所述多个图像进行高斯模糊处理。
3.根据权利要求1所述的方法,其特征在于,
所述图像的边缘标注数据包括:用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。
4.根据权利要求3所述的方法,其特征在于,所述基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数,包括:
对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段;
基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,其中,所述第一点为所述线段上的点,所述第二点为目标垂线与该图像中的所述边缘线的交点,所述目标垂线以所述第一点为中心且垂直于所述线段,以及所述目标垂线的长度为预设长度;
基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数。
5.根据权利要求4所述的方法,其特征在于,所述基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,包括:
在所述线段上按预设步长确定多个所述第一点;
以每一所述第一点为中心绘制与所述线段垂直的多条垂线,得到多条所述目标垂线;
确定每一所述目标垂线与该图像中的所述边缘线的交点;
将每一所述目标垂线上距离所述线段最近的交点确定为所述第二点;
基于每一所述第一点与指定第二点之间的距离,确定所述第一点的标注质量评估参数,所述指定第...
【专利技术属性】
技术研发人员:谢春鸿,
申请(专利权)人:北京云聚智慧科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。