System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于生成用于训练机器学习算法的附加训练数据的方法技术_技高网

用于生成用于训练机器学习算法的附加训练数据的方法技术

技术编号:40711976 阅读:3 留言:0更新日期:2024-03-22 11:13
本发明专利技术涉及一种用于生成用于训练机器学习算法的附加训练数据的方法,其中所述方法(1)包括:提供用于训练机器学习算法的训练数据,其中所述训练数据包括来自至少一个传感器的经标记的传感器数据(2);将用于训练机器学习算法的训练数据变换成图结构,其中图结构中的节点表示在对应的传感器数据中表示的对象,并且其中图结构的起始节点表示所述至少一个传感器相对于在对应的传感器数据中表示的对象的定位(3);以及通过修改图结构来生成用于训练机器学习模型的附加训练数据(4)。

【技术实现步骤摘要】

本专利技术涉及一种用于生成用于训练机器学习算法的附加训练数据的方法,其中附加训练数据可以简单地通过基于图结构稍微变换已知的训练数据来生成。


技术介绍

1、机器学习算法基于样本数据、相应地基于训练数据来构建模型,以便在没有明确编程为做出预测或决策的情况下做出预测或决策。

2、机器学习算法在各种各样的应用中使用,所述应用例如自主驾驶和驾驶辅助应用。在自主驾驶和驾驶辅助应用中,一个主要任务是预测每个可能的驾驶任务(例如车道保持或车道改变)在给定时间点处的可能性有多大。对于给定的车辆,这样的预测任务要求概率推理框架,该概率推理框架取得所测量特征(例如速率、关于车道的相对定位)的集合,并且潜在地还有在先前时间点处的车辆驾驶任务作为输入。然后,该框架解决分类问题,并且输出当前时间点处的每个驾驶任务的似然性。最后,分类输出可以被用作用于自主驾驶功能或驾驶辅助应用功能(例如自适应巡航控制)的输入,以提高驾驶舒适性并且避免安全性问题。

3、通常,要求大量的训练数据来训练这些机器学习算法。进一步地,在自主驾驶和驾驶应用中,这样的机器学习算法应当能够非常准确地预测可能的驾驶任务,以便避免安全性问题。然而,在训练期间捕获所有的可能情形是非常困难的,其中将要求用于存储表示所有可能情形的训练数据的大量存储空间,以及用以基于表示所有可能情形的训练数据来训练机器学习算法的大量计算资源。因此,需要一种用于提供用于训练机器学习算法的训练数据、相应地提供用于训练机器学习算法的附加训练数据的改进方法。

4、文献us2021/073660 a1公开了一种用于使用训练数据的数据增强来训练机器学习算法的方法,其中包括数据实例和类标签的训练数据被访问,其中所述类标签表示来自类集的类,并且其中机器学习算法被使用训练数据来训练,其中所述训练包括通过从伪随机或确定性过程获得变量来增强训练数据,通过以取决于变量的方式修改数据实例以获得新的数据实例来导出训练数据的新的数据实例,使用具有数据实例和变量的类标签作为输入的条件可逆函数来确定新的数据实例的预测目标标签,以及在机器学习模型的训练中使用新的数据实例和预测目标标签。


技术实现思路

1、本专利技术的目的是提供一种用于提供用于训练机器学习算法的训练数据、相应地提供用于训练机器学习算法的附加训练数据的改进方法。

2、该目的通过根据权利要求1所述的用于生成用于训练机器学习算法的附加训练数据的方法来解决。

3、该目的通过根据权利要求11所述的用于生成用于训练机器学习算法的附加训练数据的系统来进一步解决。

4、根据本专利技术的一个实施例,该目的通过一种用于生成用于训练机器学习算法的附加训练数据的方法来解决,其中提供了用于训练机器学习算法的训练数据,其中训练数据包括来自至少一个传感器的经标记的传感器数据,其中训练数据被变换成图结构,其中图结构中的节点表示在对应的传感器数据中表示的对象,并且其中图结构的起始节点表示所述至少一个传感器相对于在对应的传感器数据中表示的对象的定位,并且其中通过修改图结构来生成用于训练机器学习模型的附加训练数据。

5、这里,传感器是设备、模块、机器或子系统,其检测其环境中的事件或改变,并将信息发送到其他电子器件,经常是计算机处理器。进一步地,经标记的传感器数据是由传感器获取的数据,一个或多个有意义和有信息的标签已经被添加到所述由传感器获取的数据以提供上下文,使得机器学习算法可以从其学习。

6、进一步地,图结构包括节点(相应地顶点或点)的有限集合,以及这些节点的对的集合。起始节点进一步地是相应地基于其从其开始构建图结构的节点。

7、所述对象被表示在传感器数据中进一步意味着所述对象可以在对应的传感器数据中被检测到。

8、因此,应当被包括在用于训练机器学习算法的训练数据中的合理场景,例如应当被包括在训练数据中以便避免安全性问题的合理场景,可以基于已知的训练数据使用数据增强技术、相应地使用用于通过添加已经存在的数据的经稍微修改的副本来增加数据量的技术来生成。因此,可以使用更小的训练数据集,并且节省了所要求的存储空间,其中所要求的附加训练数据可以通过稍微修改已知的训练数据来生成。

9、进一步地,通过使用图结构来生成附加训练数据,可以量化和简化训练数据、相应地量化和简化基于简单的操作生成的附加训练数据,而将不要求资源密集的适配。

10、因此,提供了一种用于提供用于训练机器学习算法的训练数据、相应地提供用于训练机器学习算法的附加训练数据的改进方法。

11、从至少一个传感器提供用于训练机器学习算法的训练数据的步骤可以包括由所述至少一个传感器获取传感器数据,以及基于在所获取的传感器数据中表示的对象的特征(相应地特性)标记所获取的传感器数据,以生成用于训练机器学习算法的训练数据。

12、所述获取的传感器数据被标记意味着一个或多个有意义和有信息的标签被添加到传感器数据以提供上下文,使得机器学习算法可以从其学习。

13、因此,用于生成用于训练机器学习算法的附加训练数据的方法可以考虑除了在其上实行该方法的数据处理装备之外的特征,相应地,附加训练数据的生成是从除了在其上实行该方法的数据处理装备之外的特征来确定的。

14、在一个实施例中,通过修改图结构来生成用于训练机器学习算法的附加训练数据的步骤包括丢弃图结构的至少一个节点。

15、从图结构中丢弃所述至少一个节点意味着从图结构中完全移除所述至少一个节点,其中所述至少一个节点优选地是对象节点,相应地是表示对象的节点,并且不是起始节点。

16、通过从图结构中丢弃至少一个节点,可以简单地创建模拟缺少信息(相应地是关于对象的信息,例如未检测到的车辆)的场景。由此,应当被包括在训练数据中例如以便避免安全性问题的合理场景可以基于已知的训练数据生成,并且被包括在机器学习算法的训练中。

17、通过修改图结构来生成用于训练机器学习算法的附加训练数据的步骤可以进一步包括向图结构的至少一个节点添加扰动。

18、向图结构的至少一个节点添加扰动意味着至少一个对象的至少一个特征,例如所述至少一个对象的定位,并且因此还有表示所述至少一个对象的节点的定位被稍微改变,其中所述至少一个节点优选地是对象节点,并且不是起始节点。

19、通过向图结构的至少一个节点添加扰动,可以简单地创建模拟其中噪声被包括在所获取的传感器数据中的情形的场景,这导致当通过机器学习算法基于所获取的传感器数据生成输出时的不确定性。由此,应当被包括在训练数据中例如以便避免安全性问题的合理场景可以基于已知的训练数据来生成,并且被包括在机器学习算法的训练中。

20、通过修改图结构来生成用于训练机器学习算法的附加训练数据的步骤还可以包括对图结构的至少一部分进行镜像。

21、图结构部件的所述至少一部分被镜像意味着在一个维度中的至少两个对象的定位,并且因此还有在一个维度中的表示这些对象的节点的定位被本文档来自技高网...

【技术保护点】

1.用于生成用于训练机器学习算法的附加训练数据的方法,其中所述方法(1)包括:

2.根据权利要求1所述的方法,其中从至少一个传感器提供用于训练机器学习算法的训练数据(2)的步骤包括:

3.根据权利要求1或2所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

4.根据权利要求1至3中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

5.根据权利要求1至4中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

6.根据权利要求1至5中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

7.根据权利要求1至6中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

8.根据权利要求1至7中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

9.用于训练机器学习算法的方法,其中所述方法包括:

10.用于基于机器学习算法控制车辆的可控功能的方法,其中所述方法包括:

11.用于生成用于训练机器学习算法的附加训练数据的系统,其中所述系统(50)被配置为执行根据权利要求1至8中的一项所述的用于生成用于训练机器学习算法的附加训练数据的方法。

12.用于训练机器学习算法的系统,其中所述系统包括:提供单元,其中所述提供单元被配置为提供用于训练机器学习算法的训练数据;根据权利要求11所述的用于训练用于训练机器学习算法的附加训练数据的系统,其中用于训练附加训练数据的系统被配置为基于训练数据生成用于训练机器学习算法的附加训练数据;以及训练单元,其中所述训练单元被配置为基于训练数据和附加训练数据来训练机器学习算法。

13.用于基于机器学习算法来控制车辆的可控功能的控制单元,其中所述控制单元包括提供单元,其中所述提供单元被配置为提供用于控制可控功能的机器学习算法,其中所述机器学习算法由根据权利要求12所述的用于训练机器学习算法的系统来训练,以及控制单元,其中所述控制单元被配置为基于经训练的机器学习算法来控制可控功能。

14.包括指令的计算机程序,当所述程序由计算机执行时,所述指令使计算机执行根据权利要求1至8中的一项所述的用于生成用于训练机器学习算法的附加训练数据的方法。

15.具有根据权利要求14所述的计算机程序存储在其上的计算机可读介质。

...

【技术特征摘要】

1.用于生成用于训练机器学习算法的附加训练数据的方法,其中所述方法(1)包括:

2.根据权利要求1所述的方法,其中从至少一个传感器提供用于训练机器学习算法的训练数据(2)的步骤包括:

3.根据权利要求1或2所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

4.根据权利要求1至3中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

5.根据权利要求1至4中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

6.根据权利要求1至5中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

7.根据权利要求1至6中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

8.根据权利要求1至7中的一项所述的方法,其中通过修改图结构来生成用于训练机器学习算法的附加训练数据(4)的步骤包括:

9.用于训练机器学习算法的方法,其中所述方法包括:

10.用于基于机器学习算法控制车辆的可控功能的方法,其中所述方法包括:

【专利技术属性】
技术研发人员:E·科斯曼A·希雷马斯B·拉基奇G·古尔孙J·瓦格纳M·赫尔曼Y·姚
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1