一种数据标注系统、方法、终端以及存储介质技术方案

技术编号:32904933 阅读:19 留言:0更新日期:2022-04-07 11:55
本申请涉及一种数据标注系统、方法、终端以及存储介质。所述系统包括数据可视化模块、参数设定模块及标注交互模块;参数设定模块用于导入待标注文件,并设置待标注文件的标注参数;数据可视化模块用于根据设定的标注参数通过窗口展示待标注文件;标注交互模块用于根据设定的标注参数展示标签元素,并接收用户对待标注文件所选择的标签元素,生成标注后的文件数据。本申请实施例针对需要进行人工标注的数据提供一个统一的可视化数据标注平台,使标注人员可以在可视化的基础上快速简便地生成数据标签,降低了对标注人员的专业能力要求,对于毫无编程经验的标注人员亦可简便、快速且准确地进行数据标注,还可简化算法工程师在数据预处理方面的过程。预处理方面的过程。预处理方面的过程。

【技术实现步骤摘要】
一种数据标注系统、方法、终端以及存储介质


[0001]本申请属于机器学习
,特别涉及一种数据标注系统、方法、终端以及存储介质。

技术介绍

[0002]无论是传统的机器学习还是深度学习算法,其中的分类算法均属于有监督的训练方式。而对于需要大量样本的有监督学习,其数据标注过程是目前机器学习框架比较完善的基础之上最为繁杂且劳动密集的工作,其中又尤以时序数据的标注过程最甚。有监督学习之所以称为有监督是指有真实的标签作为机器学习算法预测值的参照,这样就可以根据预测值与真实数据之间的距离来计算损失等指标,从而不断迭代优化算法。其中真实的标签来自于人工标注,往往需要耗费专业人员大量的时间与精力。
[0003]目前,以数字信号为代表的数据标注过程中,标注人员往往需要先拿到所有周期的或一定时间长度的波形数据,然后由编程人员绘制某段数据的波形或由其它工具给出的波形图纸来判断该时间段内的数据属于哪一类标签,然后对该时间段内的波形打上相应的标签。另外一种方法是使用已经训练好的模型对新的数据打标签,这种方法本质上属于预测,往往需要结合人工复检,且对于许多还没有训练好模型的领域,那么最初的数据标注方法仍然需要人工操作。
[0004]综上所述,现有的数据标注缺乏一个统一的数据标注平台,对人工编程能力要求极高,对于毫无编程经验的工作人员来说,无法快速且准确地进行数据标注。

技术实现思路

[0005]本申请提供了一种数据标注系统、方法、终端以及存储介质,旨在至少在一定程度上解决现有技术中的上述技术问题之一。/>[0006]为了解决上述问题,本申请提供了如下技术方案:
[0007]一种数据标注系统,包括数据可视化模块、参数设定模块及标注交互模块;所述参数设定模块用于导入待标注文件,并设置待标注文件的标注参数;所述数据可视化模块用于根据设定的标注参数通过窗口展示待标注文件;所述标注交互模块用于根据设定的标注参数展示标签元素,并接收用户对待标注文件所选择的标签元素,生成标注后的文件数据。
[0008]本申请实施例采取的技术方案还包括:所述数据可视化模块包括上个窗口数据可视化单元、当前窗口数据可视化单元以及下个窗口数据可视化单元;
[0009]所述上个窗口数据可视化单元、当前窗口数据可视化单元以及下个窗口数据可视化单元分别用于根据参数设定模块设置的标签参数展示上个窗口的波形数据、当前窗口的波形数据以及下个窗口的波形数据。
[0010]本申请实施例采取的技术方案还包括:所述参数设定模块包括选择文件单元、标签导出单元、窗口大小设置单元、步长大小设置单元、标签元素设定单元以及标签管理单元;
[0011]所述选择文件单元用于选择待标注文件的导入路径并导入文件;
[0012]所述标签导出单元用于导出标签;
[0013]所述窗口大小设置单元用于设置波形数据的窗口大小win_size,win_size表示一个窗口内的数据个数;
[0014]所述步长大小设置单元用于设置波形数据的步长大小stride_size;一个窗口内的数据起始位置索引为s=i*stride_size,结束位置索引为e=s+win_size;其中i表示当前窗口,从0开始;
[0015]所述标签元素设定单元用于设置待标注文件的标签元素;
[0016]所述标签管理单元用于对设置的标签元素进行存储或删除。
[0017]本申请实施例采取的技术方案还包括:假设所述待标注文件的长度为T,长度T、窗口大小win_size和步长大小stride_size之间的约束关系为:T>=(stride_size+win_size)。
[0018]本申请实施例采取的技术方案还包括:所述参数设定模块还包括复选单元,所述复选单元用于判断待标注文件是否是高维数据,如果是高维数据,设置所述高维数据的主通道main_channel参数;
[0019]所述高维数据表示待标注文件的通道数大于1。
[0020]本申请实施例采取的技术方案还包括:所述标注交互模块包括窗口选择单元、标签复选单元和标签选择单元;
[0021]所述窗口选择单元用于选择上个窗口或下个窗口;
[0022]所述标签复选单元用于显示所述参数设置模块设置的标签元素,并从所述标签元素中选择当前窗口的标签元素;
[0023]所述标签选择单元用于确定是否为当前窗口的数据波形打上所选择的标签元素。
[0024]本申请实施例采取的另一技术方案为:一种数据标注方法,包括:
[0025]导入待标注文件,并设置待标注文件的标注参数;所述标注参数包括窗口大小、步长大小以及标签元素;
[0026]根据设定的标注参数通过窗口展示待标注文件;
[0027]根据设定的标注参数展示标签元素,并接收用户对待标注文件所选择的标签元素,生成标注后的文件数据。
[0028]本申请实施例采取的技术方案还包括:所述设置待标注文件的标注参数还包括:
[0029]判断所述待标注文件是否是高维数据,如果是高维数据,设置所述高维数据的主通道main_channel参数;
[0030]所述高维数据表示待标注文件的通道数大于1。
[0031]本申请实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
[0032]所述存储器存储有用于实现所述数据标注方法的程序指令;
[0033]所述处理器用于执行所述存储器存储的所述程序指令以控制数据标注。
[0034]本申请实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行所述数据标注方法。
[0035]相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的数据标注
系统、方法、终端以及存储介质针对需要进行人工标注的数据提供一个统一的可视化数据标注平台,使得标注人员可以在可视化的基础上快速简便地生成数据标签,降低了对标注人员的专业能力要求,对于毫无编程经验的标注人员亦可简便、快速且准确地进行数据标注工作,同时还可简化算法工程师在数据预处理方面的过程。
附图说明
[0036]图1是本申请实施例的数据标注系统的结构示意图;
[0037]图2为本申请实施例的数据标注系统的原型图;
[0038]图3为本申请实施例的数据标注方法的流程图;
[0039]图4为本申请实施例的终端结构示意图;
[0040]图5为本申请实施例的存储介质的结构示意图。
具体实施方式
[0041]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0042]请参阅图1,是本申请实施例的数据标注系统的结构示意图。本申请实施例的数据标注系统包括数据可视化模块10、参数设定模块20及标注交互模块30。其中,参本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据标注系统,其特征在于,包括数据可视化模块、参数设定模块及标注交互模块;所述参数设定模块用于导入待标注文件,并设置待标注文件的标注参数;所述数据可视化模块用于根据设定的标注参数通过窗口展示待标注文件;所述标注交互模块用于根据设定的标注参数展示标签元素,并接收用户对待标注文件所选择的标签元素,生成标注后的文件数据。2.根据权利要求1所述的数据标注系统,其特征在于,所述数据可视化模块包括上个窗口数据可视化单元、当前窗口数据可视化单元以及下个窗口数据可视化单元;所述上个窗口数据可视化单元、当前窗口数据可视化单元以及下个窗口数据可视化单元分别用于根据参数设定模块设置的标签参数展示上个窗口的波形数据、当前窗口的波形数据以及下个窗口的波形数据。3.根据权利要求2所述的数据标注系统,其特征在于,所述参数设定模块包括选择文件单元、标签导出单元、窗口大小设置单元、步长大小设置单元、标签元素设定单元以及标签管理单元;所述选择文件单元用于选择待标注文件的导入路径并导入文件;所述标签导出单元用于导出标签;所述窗口大小设置单元用于设置波形数据的窗口大小win_size,win_size表示一个窗口内的数据个数;所述步长大小设置单元用于设置波形数据的步长大小stride_size;一个窗口内的数据起始位置索引为s=i*stride_size,结束位置索引为e=s+win_size;其中i表示当前窗口,从0开始;所述标签元素设定单元用于设置待标注文件的标签元素;所述标签管理单元用于对设置的标签元素进行存储或删除。4.根据权利要求3所述的数据标注系统,其特征在于,假设所述待标注文件的长度为T,长度T、窗口大小win_size和步长大小stride_size之间的约束关系为:T&a...

【专利技术属性】
技术研发人员:马良颜延王磊
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1