【技术实现步骤摘要】
一种标注数据自动质检方法
本专利技术涉及数据处理
,尤其涉及一种标注数据自动质检方法。
技术介绍
对于AI行业,数据标注需求量越来越大,传统方法是由人工抽查做质量检查,通过人工质检后查看合格率,通常每返回一批数据就抽查一次,耗时耗力。
技术实现思路
本专利技术所要解决的技术问题是针对上述现有技术的不足提供一种标注数据自动质检方法,从而只需抽样标注一批标准数据即可用于检测每一批的标注质量,省事省力。为实现上述目的,本专利技术提供一种标注数据自动质检方法,所述方法包括:S1,获取待标注数据,并将所述待标注数据分为n个批次,每个批次包含m条数据;S2,从每个批次的数据中抽取预设数量的数据进行标注,作为已标注的初始标准数据集;S3,将所述初始标准数据集加入到每个批次的数据中,并对混有所述初始标准数据集的每个批次的数据进行标注;S4,通过对步骤S3中已标注的数据进行检测,并由后台自动计算所述初始标准数据集的准确率;S5,判断所述准确率是否达到预设标准值,若是,则 ...
【技术保护点】
1.一种标注数据自动质检方法,其特征在于,包括:/nS1,获取待标注数据,并将所述待标注数据分为n个批次,每个批次包含m条数据;/nS2,从每个批次的数据中抽取预设数量的数据进行标注,作为已标注的初始标准数据集;/nS3,将所述初始标准数据集加入到每个批次的数据中,并对混有所述初始标准数据集的每个批次的数据进行标注;/nS4,通过对步骤S3中已标注的数据进行检测,并由后台自动计算所述初始标准数据集的准确率;/nS5,判断所述准确率是否达到预设标准值,若是,则通过自动质检;否则,执行步骤S2进行重新标注。/n
【技术特征摘要】
1.一种标注数据自动质检方法,其特征在于,包括:
S1,获取待标注数据,并将所述待标注数据分为n个批次,每个批次包含m条数据;
S2,从每个批次的数据中抽取预设数量的数据进行标注,作为已标注的初始标准数据集;
S3,将所述初始标准数据集加入到每个批次的数据中,并对混有所述初始标准数据集的每个批次的数据进行标注;
S4,通过对步骤S3中已标注的数据进行检测,并由后台自动计算所述初始标准数据集的准确率;
S5,判断所述准确率是否达到预设标准值,若是,则通过自动质检;否则,执行步骤S2进行重新标注。
2.根据权利要求1所述的一种标注数据自动质检方法,其特征在于,在步骤S4中,计算所述初始标准数据集的准确率为通过抽取步骤S3已标注的数据中的所述初始标准数据集,并作为第一标注阈值,将所述...
【专利技术属性】
技术研发人员:邹辉,肖龙源,蔡振华,李稀敏,刘晓葳,谭玉坤,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。