System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于确定用于训练模型的训练数据的方法技术_技高网

用于确定用于训练模型的训练数据的方法技术

技术编号:40602133 阅读:4 留言:0更新日期:2024-03-12 22:07
本公开涉及一种用于确定针对特别是用于解决主要识别任务的主要模型的训练数据的方法(100)。

【技术实现步骤摘要】


技术介绍

1、机器人
的一个重要问题是环境感知、也称为感知(perception)。这涉及使用传感器来检测自主或半自主或者说自动化或半自动化地行动的机器的周围环境,并使用模式识别方法对所述周围环境进行识别,即将传感器数据转换为所述周围环境的相关方面的符号描述。然后,该符号描述构成在周围环境中执行与机器的应用或使用目的相对应的动作的基础。针对周围环境的符号表示的一个典型例子是使用属性来描述静态和动态对象,所述属性例如表征相应对象的方位、形状、大小、速度等等。构成符号表示的属性被称为标记(label)。这些对象可以是例如必须避免与其碰撞的障碍物。

2、这种对环境的感知通常基于单个传感器或多个传感器的组合提供的数据。处理这些传感器数据以生成周围环境的符号表示是一个复杂的模式识别问题。最佳的识别能力(erkennungsleistung)、即最小的错误概率通常是通过经过训练的方法来实现的,特别是通过人工的“深度”神经网络,英文:deep neural networks(深度神经网络)而实现的,所述深度神经网络的架构具有较多数目的隐藏层,英文:hidden layers(隐藏层)。

3、为了能够训练此类方法,需要经标记的样本(stichprobe),所述经标记的样本由所记录的传感器测量结果和相关标记、即传感器所检测的对象的符号描述组成。训练样本的大小及其所包含的传感器数据的统计分布对于由所述训练材料生成的经训练的模型的可实现的识别能力、即准确性、可靠性和普遍适用性(allgemeingültigkeit)而言至关重要。对于普遍适用性而言尤其重要的是,对于相应应用而言相关的所有可能影响传感器数据特性的条件都在训练数据中得到充分反映(abbilden)。这代表一个特殊的挑战,因为许多相关条件最初并不完全已知,而且某些条件比较少有地出现,也称为“长尾问题(long-tail-problem)”。

4、本公开描述了可以解决该问题的方法。


技术实现思路

1、一个实施方式涉及一种用于确定针对特别是用于解决主要识别任务的主要模型的训练数据的方法,该方法包括具有至少以下步骤的迭代过程:提供至少一个经标记的训练样本;使用经标记的训练样本训练该主要模型;提供至少一个经标记的测试样本;根据经标记的测试样本鉴于主要识别任务方面来评估主要模型的识别能力;以及根据识别能力的评估结果,要么a)重新执行迭代过程的步骤,要么b)终止迭代过程。

2、主要模型被理解为要被训练来解决主要识别任务的模型。因此,主要识别任务是要使用可训练模型(此处为主要模型)来解决的任务。在机器人的环境感知的上下文中,主要识别任务的目标例如是生成机器人环境中对象的符号描述。

3、在本专利技术的范畴内,样本分别被理解为一定量的数据。样本基本上可以被考虑用作用于训练主要模型的训练数据。一个样本包括多个样本元素,也称为采样(sample)。这涉及例如真实的测量数据,例如所检测的传感器数据。在根据本专利技术的方法中,这些采样在相应的处理步骤中分别以可相对应地处理的格式而存在。可以对采样采取相对应的数据处理步骤。在本专利技术的范畴内不对这样的处理步骤进一步予以阐述。

4、例如,基于最初未标记的样本来提供经标记的训练样本和/或经标记的测试样本。

5、与现有的解决方案相比,这里描述的迭代方法基于:通过选择未标记的样本的采样而构建至少部分手动标记的训练样本,其中与另外选取的相同大小的训练集相比,利用所述至少部分手动标记的训练样本而使经训练的模型的识别能力最大化。为了最大化模型的识别能力与经标记的训练样本的大小之间的比在该方法的过程中不断评估经迭代优化的模型的识别能力,从而可以根据对这种识别能力的分析而进行对另外的训练数据的选择。

6、该方法的一个重要要素因此是根据测试样本而评估经训练的主要模型的识别结果。根据评估结果,可以标识模型中的弱点。可以选择或获取合适的附加训练材料。还可以提供主要模型的准确性、可靠性和/或普遍适用性的证据。

7、根据一个实施方式而规定,该方法包括:提供未标记的样本。例如,一定量的未标记的数据被理解为未标记的样本,所述未标记的数据原则上可被考虑用于生成用于训练主要模型的训练数据。这种未标记的数据例如基于真实测量数据,例如基于所检测的传感器数据。根据本专利技术的示例,在测量行驶(messfahrt)期间利用装备有至少一个相应传感器或传感器组的车辆而记录传感器数据,其中待优化的模型是基于所述传感器或传感器组的传感器数据而设计的。传感器数据通常与时间戳一起被记录并存储在非易失性数据载体上。所记录的传感器数据的整体可以被称为未标记的样本。

8、根据一个实施方式而规定,该方法还包括:特别是使用主要模型来为未标记的样本生成预标记(pre-labeln),和/或特别是使用辅助模型来为未标记的样本生成标签(tag)。

9、例如,使用一个或多个模型(例如使用根据训练数据而训练的模型)和/或其他算法自动生成预标记或标签。如果使用至少一个模型,则它可以是主要模型本身,或者是解决要使用迭代方法而优化的主要识别任务的模型。它也可以是另外的模型,这里是辅助模型,所述辅助模型解决另外的辅助识别任务。辅助识别任务可以包括例如表征天气条件或纳入其他周围环境参数。

10、如果它是主要模型,或者是解决主要识别任务的模型,则以此生成的标记被称为预标记。这些标记在此是在该方法的后续步骤中使用手动标记所创建的相同类型的标记。

11、如果涉及的是解决辅助识别任务的辅助模型,则以此生成的标记被称为标签。标签代表对那些可能影响到主要识别任务的条件的符号描述。

12、替代地和/或附加地,可以手动生成预标记和/或标签。

13、根据一个实施方式而规定,该方法还包括:评估预标记和/或标签,并且基于对所述预标记和/或标签的评估而选择用于生成经标记的训练样本的第一子样本并选择用于生成经标记的测试样本的另一子样本。

14、在特别是自动地生成预标记和/或标签之后执行:对预标记和/或标签的特别是自动的评估。这种自动评估的目标是限定如下样本,所述样本表示未标记的样本的子集,并且可用于达成对模型的改进。这样限定的样本被称为子样本或子样本(teil-stichprobe)。

15、如果所述第一子样本和所述另一子样本不相交(disjunkt),则是有利的。训练样本和测试样本的选择和组成可以使用相同的参数来进行。然而,也可以有利的是,使用不同的参数来进行训练和测试样本的选择和组成。

16、根据一个实施方式而规定,该方法还包括:基于第一子样本生成经标记的训练样本以及基于另一子样本生成经标记的测试样本。通过生成标记而为上一步骤中所选择的子样本生成标记。这些标记代表了一种与主要识别问题相对应的符号描述。根据本公开的示例,其可以是针对车辆周围环境中的对象的位置和/或其他属性的参考(referenz)。可证实为有利的是,手动进行标记。

17、本文档来自技高网...

【技术保护点】

1.用于确定针对特别是用于解决主要识别任务的主要模型的训练数据的方法(100),所述方法包括具有至少以下步骤的迭代过程:

2.根据权利要求1所述的方法(100),其中所述方法包括:提供(110)未标记的样本(S_oL)。

3.根据权利要求2所述的方法(100),其中所述方法还包括:特别是使用所述主要模型为所述未标记的样本(S_oL)生成(120)预标记(Pre_L),和/或特别是使用辅助模型为所述未标记的样本(S_oL)生成(120)标签(T)。

4.根据权利要求3所述的方法(100),其中所述方法还包括:用于评估所述预标记(Pre_L)和/或标签(T)并且基于对所述预标记(Pre_L)和/或标签(T)的评估而选择用于生成经标记的训练样本(S1_Train)的第一子样本(S1)并选择用于生成经标记的测试样本(S2_Test)的另一子样本(S2)的步骤(130)。

5.根据权利要求4所述的方法(100),其中在评估时考虑以下要素中的至少一个:a)样本中各个采样的相似度;b)采样对于所述主要模型的训练而言的相关性;c)所述子样本中的条件的比率;d)表征所述主要识别问题的识别准确性和/或可靠性的度量之间的相关性和/或表征所述主要识别问题的识别准确性和/或可靠性的度量与标签之间的相关性;e)所述主要识别任务的连续的和/或经修改的度量;g)特定传感器的识别能力。

6.根据权利要求4或5中任一项所述的方法(100),其中所述方法还包括:基于所述第一子样本(S1)生成(140)经标记的训练样本(S1_Train)并且基于所述另一子样本(S2)生成(140)经标记的测试样本(S2_Test)。

7.根据权利要求6所述的方法(100),其中,基于预标记(Pre_L),特别是根据所述预标记(Pre_L)的置信度而执行:生成针对所述第一子样本(S1)和/或所述另一子样本(S2)的标记(L)。

8.根据前述权利要求中任一项所述的方法(100),其中根据所述识别能力的评估结果而对迭代过程的步骤的重新执行包括以下步骤中的至少一个或多个:a)提供未标记的样本(S);b)生成针对所述未标记的样本(S)的预标记(Pre_L)和/或标签(T);c)评估所述预标记(Pre_L)和/或标签(T),并且基于对所述预标记(Pre_L)和/或标签(T)的评估而选择用于生成经标记的训练样本(S1_Train)的第一子样本(S1),并选择用于生成经标记的测试样本(S2_Train)的另一子样本(S2);d)基于所述第一子样本(S1)生成经标记的训练样本(S1_Train)并基于所述另一子样本(S2)生成经标记的测试样本(S2_Test)。

9.根据前述权利要求中任一项所述的方法(100),其中,根据用于表征所述主要模型的所述主要识别任务的可靠性和/或准确性的度量而进行对所述主要模型的识别能力的评估(160)。

10.按照根据前述权利要求中任一项所述的方法(100)所确定的训练数据的用途,所述训练数据用于训练主要模型,特别是用于解决主要识别任务的主要模型。

...

【技术特征摘要】

1.用于确定针对特别是用于解决主要识别任务的主要模型的训练数据的方法(100),所述方法包括具有至少以下步骤的迭代过程:

2.根据权利要求1所述的方法(100),其中所述方法包括:提供(110)未标记的样本(s_ol)。

3.根据权利要求2所述的方法(100),其中所述方法还包括:特别是使用所述主要模型为所述未标记的样本(s_ol)生成(120)预标记(pre_l),和/或特别是使用辅助模型为所述未标记的样本(s_ol)生成(120)标签(t)。

4.根据权利要求3所述的方法(100),其中所述方法还包括:用于评估所述预标记(pre_l)和/或标签(t)并且基于对所述预标记(pre_l)和/或标签(t)的评估而选择用于生成经标记的训练样本(s1_train)的第一子样本(s1)并选择用于生成经标记的测试样本(s2_test)的另一子样本(s2)的步骤(130)。

5.根据权利要求4所述的方法(100),其中在评估时考虑以下要素中的至少一个:a)样本中各个采样的相似度;b)采样对于所述主要模型的训练而言的相关性;c)所述子样本中的条件的比率;d)表征所述主要识别问题的识别准确性和/或可靠性的度量之间的相关性和/或表征所述主要识别问题的识别准确性和/或可靠性的度量与标签之间的相关性;e)所述主要识别任务的连续的和/或经修改的度量;g)特定传感器的识别能力。

6.根据权利要求4或5中任一项所述的方法(100),其中所述方法还包括:基于所述第一子样本(s1)...

【专利技术属性】
技术研发人员:C·哈瑟舒茨H·赫特兰J·利特克O·罗佳拉
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1