当前位置: 首页 > 专利查询>罗伯特专利>正文

用于生成尤其用于训练神经网络的加标签的数据的方法技术

技术编号:29201629 阅读:25 留言:0更新日期:2021-07-10 00:36
用于生成尤其用于训练神经网络的加标签的数据的方法。本公开涉及用于生成尤其用于神经网络的加标签的数据、例如训练数据的方法(100,1000)和设备(200)。1000)和设备(200)。1000)和设备(200)。

【技术实现步骤摘要】
用于生成尤其用于训练神经网络的加标签的数据的方法


[0001]本公开涉及一种用于生成尤其用于未加标签的数据的标签的方法。所得到的加标签的数据例如可以被用作训练数据,尤其用于神经网络。
[0002]此外,本公开涉及一种用于执行第一方法和/或其他方法的设备。

技术介绍

[0003]机器学习、尤其利用神经网络、尤其深度神经网络(英语:Deep Neural Network,DNN)进行学习的方法在许多问题的情况下胜过经典的未经训练的用于模式识别的方法。几乎所有这些方法都基于监督式学习。
[0004]监督式学习需要带注释的或加标签的数据作为训练数据。在下文中也称为标签的这些注释用作优化算法的目标输出。在此给每个数据元素分配至少一个标签。
[0005]标签的质量可能对机器学习方法的经训练的模型的识别性能有影响。从现有技术中已知手动地给用于训练机器学习方法的样本加标签。

技术实现思路

[0006]本公开提供相对于现有技术改进的用于生成标签的方法。
[0007]一种实施方式涉及一种用于生成用于数据集的标签的方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于生成用于数据集(S)的标签(L)的方法(100),所述方法(100)包括:提供(110)未加标签的数据集(S),所述未加标签的数据集包括未加标签的数据的第一子集(SA)和未加标签的数据的至少一个与所述第一子集不相交的其他子集(SB);通过生成用于所述第一子集(SA)的标签(L_A_1)来生成加标签的第一子集(SA_L_1)并且提供(130)所述加标签的第一子集(SA_L_1)作为第n个加标签的第一子集(SA_L_n),其中n=1;执行(140)迭代过程,其中所述迭代过程的第n次迭代针对每个n=1、2、3、...N包括如下步骤:利用所述第n个加标签的第一子集(SA_L_n)来训练(141n)第一模型(MA)作为第n个经训练的第一模型(MA_n);通过在使用所述经训练的模型(MA_n)的情况下预测用于所述其他子集(SB)的标签(L_B_n)来生成(142n)第n个加标签的其他子集(SB_L_n);利用所述第n个加标签的其他子集(SB_L_n)来训练(143n)其他模型(MB)作为第n个经训练的其他模型(MB_n);通过在使用所述第n个经训练的其他模型(MB_n)的情况下预测用于所述第一子集(SA)的标签(L_A_n+1)来生成(144n)第(n+1)个加标签的第一子集(SA_L_n+1)。2.根据权利要求1所述的方法(100),其中在所述迭代过程(140)的第n次迭代之后利用所述第n个加标签的第一子集(SA_L_n)和/或所述第n个加标签的其他子集(SB_L_n)来训练(150)最终模型(M_f)。3.根据权利要求2所述的方法(100),其中通过借助所述最终模型(M_f)预测用于所述数据集(S)的标签(L_f)来生成(160)加标签的数据集(S_L)和/或最终的加标签的数据集(S_L_f)。4.根据上述权利要求中的至少一个或多个所述的方法(100),其中所述生成(120)加标签的第一子集(SA_L_1)通过利用初始模型(MC)预测标签来进行。5.根据上一权利要求所述的方法(100),其中所述初始模型(MC)在先前的步骤中利用加标签的初始子集(SC_L)来训练(114),其中所述初始子集(SC)与所述第一子集和所述其他子集(SA,SB)尤其不相交。6.根据上一权利要求所述的方法(100),其中所述初始子集(SC)小于所述第一子集(SA)和/或小于所述其他子集(SB)。7.根据上述权利要求中至少一个所述的方法(100),其中只要还不满足质量标准和/或中止标准,所述迭代过程(140)的步骤(141n,142n,143n)就重复地被实施。8.根据上述权利要求中至少一个所述的方法(100),其中所述第一模型(MA)和/或所述其他模型(MB)和/或所述初始模型(MC)和/或所述最终模型(M_f)包括神经网络、尤其深度神经网络。9.根据上述权利要求中至少一个所述的方法(100),其中所述方法(100)此外包括:提高所述第一模型和/或所述其他模型和/或所述最终模型的复杂度。10.一种用于生成用于数据集(S)的标签(L)的方法(1000),所述方法包括:提供(1100)未加标签的数据集(S),所述未加标签的数据集包括未加标签的数据的第一子集(SA)和未加标签的数据的至少一个尤其与所述第一子集不相交的其他子集(SB),其
中所述子集SB包括至少一个第一次子集SB_1和第二次子集SB_2,尤其k个次子集(SB_k),其中k=1、2、3

...

【专利技术属性】
技术研发人员:C
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1