非结构化数据标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33131885 阅读:30 留言:0更新日期:2022-04-17 00:49
本发明专利技术实施例公开了非结构化数据标注方法、装置、计算机设备及存储介质。所述方法包括:获取图片数据;将所述图片数据输入至标注模型内进行标签标注,以得到标注结果;输出所述标注结果;其中,所述标注模型是指通过若干个带有标注标签的图像数据作为样本集训练专家模型所得的。通过实施本发明专利技术实施例的方法可实现快速高效地对非结构化数据进行打标和清洗,保障了生成标签的准确性,减少错误标签的生成,降低了人工成本。降低了人工成本。降低了人工成本。

【技术实现步骤摘要】
非结构化数据标注方法、装置、计算机设备及存储介质


[0001]本专利技术涉及数据处理方法,更具体地说是指非结构化数据标注方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着人工智能技术落地越来越多的商业场景,除了无人驾驶、人脸识别、智慧安防等领域外,机器人、智能家居、智慧工地等也成为了热门的应用场景,AI高新科技公司关注的重点开始聚焦于产业落地能力上。传统的非结构化图片数据标注方式是通过专门的标注工作者或AI研发人员进行标注的,不但消耗大量的人力成本,而且在大量标注后人会出现效率低下和标注错误的情况,耗时又耗钱,需要标注大规模的数据集时十分耗费人力成本,并且标注完的数据还需要进行人工审核才能使用。并且数据是人工智能技术的基础,数据标签的准确直接影响了算法的上限,是算法实现的决定性条件之一,因此提供高效、准确的标注数据集决定了人工智能技术的应用高度,是无法缺少的。
[0003]现有的数据清洗方式,只能由人工清洗,人工删除不符合标准的数据,需要投入大量人力,增加人力成本;传统的人工数据标注和清洗方式不但效率低下,而且标注的数据质量本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.非结构化数据标注方法,其特征在于,包括:获取图片数据;将所述图片数据输入至标注模型内进行标签标注,以得到标注结果;输出所述标注结果;其中,所述标注模型是指通过若干个带有标注标签的图像数据作为样本集训练专家模型所得的。2.根据权利要求1所述的非结构化数据标注方法,其特征在于,所述标注模型是指通过若干个带有标注标签的图像数据作为样本集训练专家模型所得的,包括:获取图像数据,以得到初始数据;将所述图像数据输入至专用模型内进行标签标注,以得到第一标签;将所述图像数据输入至专家模型内进行标签标注,以得到第二标签;计算所述第一标签和第二标签的IOU,以得到计算结果;根据所述计算结果分类所述第一标签和第二标签,以得到可用标签和不可用标签;对所述不可用标签进行清洗,以得到清洗后的标签;根据所述可用标签以及清洗后的标签对所述初始数据进行标注,以形成样本集;利用样本集训练专家模型,以得到标注模型。3.根据权利要求2所述的非结构化数据标注方法,其特征在于,所述专用模型是通过带有第一标签标注的图像数据作为样本集训练专家模型所得的。4.根据权利要求2所述的非结构化数据标注方法,其特征在于,所述专家模型是对数据进行回归分类的模型。5.根据权利要求2所述的非结构化数据标注方法,其特征在于,所述计算所述第一标签和第二标...

【专利技术属性】
技术研发人员:李伟强曹应文施健王一科贾林涂静一
申请(专利权)人:深圳中智永浩机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1