用于为机器学习过程生成编码训练数据的方法、处理单元和记录系统技术方案

技术编号：38852473 阅读：15 留言：0更新日期：2023-09-17 09:59

本发明专利技术涉及一种用于生成编码后的训练数据(11)的方法，其中，处理单元(17)执行以下步骤以用于生成编码后的训练数据(11)并在测试车辆(10)的测试驾驶(T)期间将它们存储到数据存储器(19)中，该测试车辆(10)携带生成原始图像数据(16)的摄像头(12)。通过执行测试例程来测试给定视频编码器(27)是否适合于对原始图像数据进行编码以生成用于训练另一个第二人工神经网络(34

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于为机器学习过程生成编码训练数据的方法、处理单元和记录系统

[0001]本专利技术涉及一种用于为机器学习过程生成编码后的训练数据的方法。编码后的训练数据是经过视频编码器编码后的图像数据。编码后的训练数据可以用于训练人工神经网络(ANN)，使得人工神经网络能够基于摄像头图像数据识别至少一个对象。本专利技术还包括一种用于执行该方法的处理单元和一种用于记录编码后的训练数据的记录系统。

技术介绍

[0002]在自动驾驶车辆(ADV)中，人工神经网络(ANN)可用于通过评估表示由摄像头生成的图像的图像数据来观察车辆的环境。为此，ANN可以连接到摄像头以接收摄像头图像流的原始图像数据。术语“原始”意味着没有应用像MPEG编码这样的图像编码(MPEG
‑
运动图像专家组)。然而，原始图像数据可能已经被其他算法处理过，例如边缘检测算法。ANN经过训练以识别或推断原始图像数据中的对象。由于使用了原始图像数据，ANN预计不会出现图像编码伪影。
[0003]为了训练这样的ANN，需要训练数据。可以通过在汽车上安装摄像头并在测试驾驶期间将摄像头图像记录到数据存储器来生成训练数据。由于需要大量训练数据，存储原始摄像头图像数据流将需要大量数据存储(数TB)并且处理如此大量的数据(例如传输到其他计算机)将非常耗时。因此必须压缩摄像头图像数据流以减少数据量。这是通过在将原始摄像头图像存储在汽车的数据存储器中之前对其进行编码来获得的。可能的编码器是MPEG(MP4或H.264/MPEG
‑
4AVC或ISO/...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成编码后的训练数据的方法(11)，其中处理单元(17)在测试车辆(10)的测试驾驶(T)期间执行以下步骤以生成编码后的训练数据(11)并将其存储在数据存储器(19)中，所述测试车辆(10)携带生成原始图像数据(16)的摄像头(12)：从所述摄像头(12)接收所述原始图像数据(16)，和操作人工神经网络(24)ANN，其已经在原始图像训练数据上进行训练并且被训练以基于原始图像数据(22)来识别至少一个对象(15)，和使用所述人工神经网络(24)基于接收到的原始图像数据的至少一个数据序列来执行图像识别(25)，从而基于预定的评估规则来生成相应的参考识别数据(26)，其中所述参考识别数据(26)描述了在所述至少一个数据序列(23)中已经识别出的图像内容和/或所述ANN的至少一个隐藏层的激活值和/或关于所述图像内容的预定的不确定性度量的值，并且其中所述评估规则确定应使用什么类型的识别数据，其特征在于，对所述原始图像数据(16)的每个数据序列通过执行测试例程来测试给定的视频编码器(27)是否适合于对所述原始图像数据进行编码以生成用于训练另一个第二人工神经网络(34
’
)的编码后的训练数据，所述测试例程包括：使用所述人工神经网络(24)对所述数据序列(23)执行第一次图像识别(25)；作为执行所述第一次图像识别(25)的结果而获得所述参考识别数据(26)；使用配置有给定预设值(27
’
)的视频编码器(27)对所述数据序列(23)进行编码，其中编码产生编码后的序列(28)，然后使用对应的解码器对所述编码后的序列(28)进行解码，以及使用所述人工神经网络(24)对解码后的序列(28)执行第二次图像识别(29
’
)；作为执行所述第二次图像识别(29
’
)的结果并且基于所述评估规则而获得当前评估数据(29)，其中所述当前评估数据(29)描述了在所述至少一个数据序列(23)中已经识别出的图像内容和/或所述ANN的至少一个隐藏层的激活值和/或关于所述图像内容的预定的不确定性度量的值；和所述处理单元验证所述当前评估数据(29)和相应对应的参考识别数据(26)是否满足预定的相似度标准(30)，其中所述相似度标准(30)包括描述所述参考识别数据(26)与所述当前评估数据(29)之间的差异的相应差值(31)位于预定区间(32)内的条件，并且如果所述当前评估数据(29)和所述参考识别数据(26)满足所述预定的相似度标准(30)，则存储所述编码后的序列(28)和/或对另外接收到的原始图像数据(22)进行编码并且将编码后的另外的图像数据(18)作为编码后的训练数据存储在所述数据存储器(19)中。2.根据权利要求1所述的方法，其中，如果不满足所述相似度标准(30)，则中断已经在进行的编码后的图像数据(18)的存储直到再次检测到满足所述相似度标准(30)的下一个数据序列，或者将原始图像数据存储在所述数据存储器(19)中。3.根据权利要求1或2所述的方法，其中，所述测试例程包括在选择循环中执行以下步骤：使用从预定的一组可能的编码器中选择的当前视频编码器(27)和/或使用从用于当前视频编码器的相应编码参数的一组预定的可能预设值中选择的当前预设值，对所述序列的
原始图像数据进行编码，从而产生编码后的图像数据，对编码后的图像数据解码并使用ANN对解码后的图像数据执行图像识别，从而基于评估规则生成当前评估数据，验证当前评估数据是否满足关于所述参考识别数据(26)的预定的相似度标准，如果满足所述相似度标准，则中断所述选择循环并且将具有相应的当前预设值的当前视频编码器(27)用于对接收到的原始图像数据和/或针对测试驾驶期间的未来时间区间的未来原始图像数据进行编码，以生成编码后的训练数据，否则，如果不满足所述相似度标...

【专利技术属性】
技术研发人员：R，
申请(专利权)人：阿尔戈艾有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人