数据标注的方法、装置及电子设备制造方法及图纸

技术编号:33886998 阅读:71 留言:0更新日期:2022-06-22 17:20
本申请公开了一种数据标注的方法、装置及电子设备。其中,该方法包括:网络侧设备获取待标注数据集,以及获取待标注数据集中待标注数据的类型,其中,待标注数据集中的待标注数据具有第一标记,第一标记表示允许获取待标注数据;从待标注数据的类型中确定目标类型,从待标注数据集中确定属于目标类型的数据,得到目标数据;将目标数据分发给不同的目标对象;接收目标对象对目标数据进行标注后的标注结果,并存储标注结果。本申请解决了由于不同的AI公司对数据的要求不同,导致无法在全流程建立标准,只能被动的接收定制化需求的技术问题。只能被动的接收定制化需求的技术问题。只能被动的接收定制化需求的技术问题。

【技术实现步骤摘要】
数据标注的方法、装置及电子设备


[0001]本申请涉及数据标注领域,具体而言,涉及一种数据标注的方法、装置及电子设备。

技术介绍

[0002]在AI领域,尤其是以计算机视觉为主的AIOT(人工智能物联网)、自动驾驶领域中,对数据标注是很重要的依赖;从标注工具本身来说是通过可视化工具来标注现实世界中需要算法感知到的要素,涉及到对语音、图像、点云的标注等;标注本身看似技术不复杂,但为了标注进行的整个数据准备、处理、运营管理的过程是一个繁复的长链过程;目前市面上缺少对“标注工具链”的行业标准,主要受制于AI公司本身的业务繁杂,快速发展过程中制约了标准跟进步伐,如果后期去做弥补去重新建立标准而进行改造,对已有流程是较大的冲击,而数据标注多由三方专业服务商提供服务,最大的问题在于受限于不同AI公司对数据的要求不同,三方公司无法在全流程建立标准,只能被动的接收定制化需求。
[0003]建立灵活规范高可用的“标注工具链”对目前AI领域的快速发展是一个非常必要的能力,但有很多的环节需要攻克。
[0004]针对上述的问题,目前尚未提出有效的解决方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据标注的方法,其特征在于,包括:网络侧设备获取待标注数据集,以及获取所述待标注数据集中待标注数据的类型,其中,所述待标注数据集中的待标注数据具有第一标记,所述第一标记表示允许获取所述待标注数据;从所述待标注数据的类型中确定目标类型,从所述待标注数据集中确定属于所述目标类型的数据,得到目标数据;将所述目标数据分发给不同的目标对象;接收所述目标对象对所述目标数据进行标注后的标注结果,并存储所述标注结果。2.根据权利要求1所述的数据标注的方法,其特征在于,网络侧设备获取待标注数据集,包括:获取第一数据和第二数据,其中,所述第一数据为对全部原始数据进行处理后得到的数据,所述第二数据为所述第一数据中需要进行标注的数据,所述第一数据对应的第一数据表和所述第二数据对应的第二数据表存在映射关系,所述第一数据表和所述第二数据表存储在数据库中;对所述第二数据进行复制,得到第三数据,其中,所述第三数据中的每条数据都以第一命名方式命名;将所述第三数据按顺序拆分成多个批次,其中,所述多个批次中存储的数据量相同;将所述多个批次中的来自同一采集任务的数据存储在所述待标注数据集中。3.根据权利要求2所述的数据标注的方法,其特征在于,所述第二数据通过以下方式获取:依据文件类型确定所述第二数据;采用标签对所述第二数据进行标记,并记录所述第二数据和所述标签的映射关系,其中,所述标签为与所述第二数据对应的场景信息的标签。4.根据权利要求2所述的数据标注的方法,其特征在于,对所述第二数据进行复制,得到第三数据,包括:在所述第三数据的文件类型为图片格式时,过滤连续帧图片中相似度大于预设阈值的图片;将过滤后的第三数据的格式类型转换成目标格式后,以第二命名方式命名第三数据。5.根据权利要求2所述的数据标注的方法,其特征在于,将所述第三数据按顺序拆分成多个批次,包括:确定所述第三数据的数据量,以及所述多个批次中每个批次存储的最大数据量;将所述第三数据按照存储顺序依次存入所述多个批次中;在所述多个批次中的每个批次存储的数据量达到所述最大数据量时,自动将数据存入下一批次,直至所述第三数据全部存入所述多个批次中,并以第三命名方式命名所述多个批次。6.根据权利要求5所述的数据标注的方法,其特征在于,所述存储顺序为所述第三数据存储在不同文件夹下的文件顺序。7.根据权利要求2所述的数据标注的方法,其特征在于,将所述多个批次...

【专利技术属性】
技术研发人员:史明威王尔辛
申请(专利权)人:亿咖通湖北技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1