【技术实现步骤摘要】
标注数据的处理方法和装置
本专利技术涉及数据标记领域,具体而言,涉及一种标注数据的处理方法和装置。
技术介绍
数据标注的种类繁多,例如:分类、拉框、注释、标记等,其用于为机器学习构建训练数据,可以包括训练集和测试集。因此标注的准确度对训练结果的影响非常大。为了保证数据标注的准确性,需要在数据标注后对标注结果进行审核,目前通常由人工的方式对标注的结果进行审核,导致审核的效率较低。针对现有技术中对标注行为进行审核的效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种标注数据的处理方法和装置,以至少解决现有技术中对标注行为进行审核的效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种标注数据的处理方法,包括:获取目标场景的标注结果和训练结果,其中,目标场景包括多个标注对象,标注结果包括对每个标注对象的标注子结果,训练结果包括机器模型输出的对每个标注对象的识别结果;将标注结果和训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果;基于 ...
【技术保护点】
1.一种标注数据的处理方法,其特征在于,包括:/n获取目标场景的标注结果和训练结果,其中,所述目标场景包括多个标注对象,所述标注结果包括对每个标注对象的标注子结果,所述训练结果包括机器模型输出的对每个标注对象的识别结果;/n将所述标注结果和所述训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果;/n基于所述标注对象的识别子结果对所述标注对象的标注子结果进行检测,判断所述标注对象的标注子结果是否准确。/n
【技术特征摘要】
1.一种标注数据的处理方法,其特征在于,包括:
获取目标场景的标注结果和训练结果,其中,所述目标场景包括多个标注对象,所述标注结果包括对每个标注对象的标注子结果,所述训练结果包括机器模型输出的对每个标注对象的识别结果;
将所述标注结果和所述训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果;
基于所述标注对象的识别子结果对所述标注对象的标注子结果进行检测,判断所述标注对象的标注子结果是否准确。
2.根据权利要求1所述的方法,其特征在于,将所述标注结果和所述训练结果进行匹配,查找得到同一个标注对象的标注子结果和识别子结果,包括:
获取所述标注结果和所述训练结果中每个所述标注对象在所述目标场景内的位置;
确定在所述标注结果和所述训练结果中处于相同位置的标注对象为同一个标注对象。
3.根据权利要求1所述的方法,其特征在于,所述标注子结果包括对所述标注对象标注得到的类别,所述识别子结果包括所述机器模型对所述标注对象识别得到的类别,基于所述标注对象的识别子结果对所述标注对象的标注子结果进行检测,判断所述标注对象的标注子结果是否准确,包括:
检测所述标注对象的标注子结果与所述标注对象的识别子结果是否相同;
如果所述标注对象的标注子结果与所述标注对象的识别子结果不同,则确定所述标注对象存在错标。
4.根据权利要求3所述的方法,其特征在于,基于所述标注对象的识别子结果对所述标注对象的标注子结果进行检测,判断所述标注对象的标注子结果是否准确的步骤还包括:
如果所述标注对象不存在对应的标注子结果,则确定所述标注对象漏标。
5.根据权利要求1所述的方法,其特征在于,所述标注子结果包括所述标注得到的所述标注对象在所述目标场景中的第一区域,所述识别子结果包括通过所述机器模型识别得到的所述标注对象在所述目标场景中的第二区域,在基于所述标注对象的识别子结果对所述标注对象的标注子结果进行检测,判断所述标注对象的标注子结果是否准确之前,所述方法还包括:
获取所...
【专利技术属性】
技术研发人员:赵宇,
申请(专利权)人:北京小马慧行科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。