标注数据的处理方法、装置及电子设备制造方法及图纸

技术编号:35651709 阅读:13 留言:0更新日期:2022-11-19 16:47
本申请公开了一种标注数据的处理方法、装置及电子设备。其中,该方法包括:获取原始数据的标注结果;依据格式验证标准检验标注结果的格式;在标注结果的格式检验通过的情况下,确定与标注结果对应的原始数据,将标注结果和与标注结果对应的原始数据存储在相同的存储位置中;从相同的存储位置中加载标注结果以及与标注结果对应的原始数据,并对标注结果以及与标注结果对应的原始数据进行内容检验;在内容检验的准确率大于预设阈值时,确定标注结果对应的版本号。本申请解决了应用方与标注公司进行标注数据传输时是基于网盘、线下形式传输,造成数据难以在线管理、数据流转低效的技术问题。题。题。

【技术实现步骤摘要】
标注数据的处理方法、装置及电子设备


[0001]本申请涉及数据标注领域,具体而言,涉及一种标注数据的处理方法、装置及电子设备。

技术介绍

[0002]数据是人工智能算法升级迭代的原材料,算法模型效果的提升有赖于大量结构化数据的训练,这些结构化数据依赖标注人员进行人工标注。数据标注属于劳动密集型工作,大多数标注数据应用方(人工智能公司或相关部门)不会由内部人员进行数据标注,而是依赖外部三方标注公司进行数据标注,在此过程中,数据跨公司管理与传输成为必不可少的一环。目前大部分应用方与标注公司进行标注数据传输都是基于网盘、线下形式传输,没有打通标注数据传输与业务之间逻辑,造成数据难以在线管理、数据流转低效等问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种标注数据的处理方法、装置及电子设备,以至少解决应用方与标注公司进行标注数据传输时是基于网盘、线下形式传输,造成数据难以在线管理、数据流转低效的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种标注数据的处理方法,包括:获取原始数据的标注结果;依据格式验证标准检验标注结果的格式;在标注结果的格式检验通过的情况下,确定与标注结果对应的原始数据,将标注结果和与标注结果对应的原始数据存储在相同的存储位置中;从相同的存储位置中加载标注结果以及与标注结果对应的原始数据,并对标注结果以及与标注结果对应的原始数据进行内容检验;在内容检验的准确率大于预设阈值时,确定标注结果对应的版本号
[0006]可选地,依据格式验证标准检验标注结果的格式,包括:依据格式验证标准定义检验内容以及检验规则;依据格式验证标准中的检验内容和检验规则检验标注结果的格式;在检验结果不通过时,将检验不通过的标注结果以及退回原因返回给标注方设备,其中,退回原因包括以下至少之一:字段格式错误、命名错误和数据存储层级错误,标注方设备用于对原始数据进行标注;在检验结果通过时,将标注结果和与标注结果对应的原始数据存储在相同的存储位置中。
[0007]可选地,确定与标注结果对应的原始数据,包括:解析标注结果,将解析结果按照数据存储规则存储至目标目录层级中,其中,目标目录层级为标注结果对应的原始数据所在的目录层级,标注结果和与标注结果对应的原始数据具有相同的命名方式;依据解析结果的命名方式查找数据库中相同命名方式的原始数据。
[0008]可选地,对标注结果以及与标注结果对应的原始数据进行内容检验,包括:加载标注结果以及与标注结果对应的原始数据,得到待检验内容,其中,标注结果中至少包括标注物的坐标渲染结果,坐标渲染结果为依据标注物的类别将标注物的坐标渲染成不同的颜色
得到的结果;确定待检验内容的准确率,其中,准确率由正确标注的标注物的数量、标注物的总数量以及漏标的标注物的数量确定;在准确率大于预设阈值的情况下,确定标注结果的内容检验通过;在准确率小于或等于预设阈值的情况下,确定标注结果的内容检验失败,并将内容检验失败的数据帧名称列表返回给标注方设备进行重新标注。
[0009]可选地,确定标注结果对应的版本号,包括:在标注结果对应的原始数据为同一批次的原始数据的情况下,至少依据标注类型和标注结果的回收次数确定目标标注结果的版本号,其中,回收次数用于表示标注结果返回给标注方设备的次数。
[0010]可选地,确定标注结果对应的版本号,包括:在目标标注结果中存在相同命名方式的标注结果的情况下,判断是否存在相同命名方式的标注结果对应的标注类型的版本号;在判断结果为是的情况下,在已有版本号的基础上新增版本号;在判断结果为否的情况下,创建相同命名方式的标注结果对应的标注类型的第一个版本号。
[0011]可选地,确定标注结果对应的版本号之后,方法还包括:获取标注结果以及对应的原始数据,构建数据集;依据数据集中不同数据的数据类型建立图像分类模型,并优化图像分类模型中的参数,得到目标模型;依据目标模型评估不同的标注结果以及对应的原始数据,得到评估结果;确定评估结果中大于评估阈值的数据为目标数据,并增加目标数据的采集量和标注量。
[0012]可选地,方法还包括:接收目标对象的目标请求,其中,目标请求用于查看数据的流转过程,目标请求中至少包括数据的命名字段,流转过程包括以下至少之一:数据的送标过程、数据的回收过程、数据的标注结果和数据的调用记录;依据目标请求,从数据库中确定与目标请求对应的目标数据;将目标数据返回给目标对象。
[0013]根据本申请实施例的另一方面,还提供了一种标注数据的处理装置,包括:获取模块,用于获取原始数据的标注结果;检验模块,用于依据格式验证标准检验标注结果的格式;存储模块,用于在标注结果的格式检验通过的情况下,确定与标注结果对应的原始数据,将标注结果和与标注结果对应的原始数据存储在相同的存储位置中;加载模块,用于从相同的存储位置中加载标注结果以及与标注结果对应的原始数据,并对标注结果以及与标注结果对应的原始数据进行内容检验;确定模块,用于在内容检验的准确率大于预设阈值时,确定标注结果对应的版本号。
[0014]根据本申请实施例的又一方面,还提供了一种电子设备,包括:存储器,用于存储程序指令;处理器,与存储器连接,用于执行实现以下功能的程序指令:获取原始数据的标注结果;依据格式验证标准检验标注结果的格式;在标注结果的格式检验通过的情况下,确定与标注结果对应的原始数据,将标注结果和与标注结果对应的原始数据存储在相同的存储位置中;从相同的存储位置中加载标注结果以及与标注结果对应的原始数据,并对标注结果以及与标注结果对应的原始数据进行内容检验;在内容检验的准确率大于预设阈值时,确定标注结果对应的版本号。
[0015]根据本申请实施例的再一方面,还提供了一种非易失性存储介质,该非易失性存储介质包括存储的程序,其中,在程序运行时控制该非易失性存储介质所在设备执行上述标注数据的处理方法。
[0016]在本申请实施例中,通过获取原始数据的标注结果;依据格式验证标准检验标注结果的格式;在标注结果的格式检验通过的情况下,确定与标注结果对应的原始数据,将标
注结果和与标注结果对应的原始数据存储在相同的存储位置中;从相同的存储位置中加载标注结果以及与标注结果对应的原始数据进行内容检验,在内容检验的准确率大于预设阈值时,确定标注结果对应的版本号,达到了自动检验标注结果的格式和内容的目的,从而实现了在线管理标注结果的技术效果,进而解决了应用方与标注公司进行标注数据传输时是基于网盘、线下形式传输,造成数据难以在线管理、数据流转低效的技术问题。
附图说明
[0017]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0018]图1是根据本申请实施例的一种用于实现标注数据的处理方法的计算机终端(或电子设备)的硬件结构框图;
[0019]图2是根据本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标注数据的处理方法,其特征在于,包括:获取原始数据的标注结果;依据格式验证标准检验所述标注结果的格式;在所述标注结果的格式检验通过的情况下,确定与所述标注结果对应的原始数据,将所述标注结果和与所述标注结果对应的原始数据存储在相同的存储位置中;从所述相同的存储位置中加载所述标注结果以及与所述标注结果对应的原始数据,并对所述标注结果以及与所述标注结果对应的原始数据进行内容检验;在所述内容检验的准确率大于预设阈值时,确定所述标注结果对应的版本号。2.根据权利要求1所述的方法,其特征在于,依据格式验证标准检验所述标注结果的格式,包括:依据所述格式验证标准定义检验内容以及检验规则;依据所述格式验证标准中的所述检验内容和所述检验规则检验所述标注结果的格式;在检验结果不通过时,将检验不通过的标注结果以及退回原因返回给标注方设备,其中,所述退回原因包括以下至少之一:字段格式错误、命名错误和数据存储层级错误,所述标注方设备用于对所述原始数据进行标注;在所述检验结果通过时,将所述标注结果和与所述标注结果对应的原始数据存储在相同的存储位置中。3.根据权利要求1所述的方法,其特征在于,确定与所述标注结果对应的原始数据,包括:解析所述标注结果,将解析结果按照数据存储规则存储至目标目录层级中,其中,所述目标目录层级为所述标注结果对应的原始数据所在的目录层级,所述标注结果和与所述标注结果对应的原始数据具有相同的命名方式;依据所述解析结果的命名方式查找数据库中相同命名字段的原始数据。4.根据权利要求1所述的方法,其特征在于,对所述标注结果以及与所述标注结果对应的原始数据进行内容检验,包括:加载所述标注结果以及与所述标注结果对应的原始数据,得到待检验内容,其中,所述标注结果中至少包括标注物的坐标渲染结果,所述坐标渲染结果为依据所述标注物的类别将所述标注物的坐标渲染成不同的颜色得到的结果;确定所述待检验内容的准确率,其中,所述准确率由正确标注的标注物的数量、所述标注物的总数量以及漏标的标注物的数量确定;在所述准确率大于所述预设阈值的情况下,确定所述标注结果的内容检验通过;在所述准确率小于或等于所述预设阈值的情况下,确定所述标注结果的内容检验失败,并将所述内容检验失败的数据帧名称列表返回给标注方设备进行重新标注。5.根据权利要求4所述的方法,其特征在于,确定所述标注结果对应的版本号,包括:在所述标注结果对应的原始数据为同一批次的原始数据的情况下,至少依据标注类型和所述标注结果的回收次数确定所述标注结果的版本号,其中,所述回收次数用于表示所述标注结果返回给所述标注方设备的次数。6.根据权利要求4所述的方法,其特征在于,确定所述标注结果对应的版本号,包括...

【专利技术属性】
技术研发人员:李韦华顾瑞红高磊朱会超
申请(专利权)人:亿咖通湖北技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1