训练自动编码器以获得生成模型制造技术

技术编号:41742358 阅读:28 留言:0更新日期:2024-06-19 13:02
提供了一种用于在训练数据上训练自动编码器以获得用于合成新数据的生成模型的系统和方法。在所述训练期间,仿射变换320被应用于编码器310的输出,以获得潜在空间中的训练数据实例的表示。此外,潜在空间中的训练数据实例的表示的均值和协方差被确定,并且仿射变换的参数被更新以将训练数据实例的表示的均值和协方差朝向目标均值和目标协方差移位。经训练的自动编码器的解码器330可以被用作生成模型,例如以合成系统、设备或机器的测试或模拟的输入数据,或者以合成用于(另一)机器可学习模型的训练的训练数据。

【技术实现步骤摘要】

本专利技术涉及一种用于在训练数据上训练自动编码器以获得用于合成新数据的生成模型的系统和计算机实现的方法。本专利技术进一步涉及一种用于使用经训练的自动编码器的解码器作为生成模型来合成新数据的系统和计算机实现的方法。本专利技术进一步涉及一种包括数据的计算机可读介质,该数据表示用于系统执行任何计算机实现的方法的指令。


技术介绍

1、机器学习中的一个常见任务是生成建模,它涉及开发给定真实世界样本的概率分布模型。这样的生成模型意图允许合成新数据,它(近似)遵循与真实世界数据相同的概率分布。数据合成在各种应用领域中可能很有价值,特别是在不足的真实世界数据可用的应用领域。例如,针对自主驾驶领域中的机器可学习模型的测试或训练,期望能够使用所谓边角情况的传感器数据来确保机器可学习模型正确处理这样的边角情况,该边角情况可以表示意外和可能的危险情形(例如未遂事故)。然而,由于这样的边角情况本质上仅很少发生,因此几乎没有传感器数据可以可用于测试或训练。为了解决这个问题,生成模型可以在可用的传感器数据上训练,并且用于合成边角情况的新传感器数据。

2、在许多不同的生成建模本文档来自技高网...

【技术保护点】

1.一种在训练数据上训练自动编码器以获得用于合成新数据的生成模型的计算机实现的方法(200),包括:

2.根据权利要求1所述的方法(200),其中所述方法进一步包括:将均值和协方差确定为跨训练数据的子集的运行均值和运行协方差。

3.根据权利要求1或2所述的方法(200),其中所述目标均值为零。

4.根据权利要求1至3中任一项所述的方法(200),其中所述目标协方差是单位协方差。

5.根据权利要求1至4中任一项所述的方法(200),其中编码器和解码器的参数的更新(280)进一步基于正则化项,所述正则化项惩罚与由目标均值和目标协方差定义的高斯概...

【技术特征摘要】

1.一种在训练数据上训练自动编码器以获得用于合成新数据的生成模型的计算机实现的方法(200),包括:

2.根据权利要求1所述的方法(200),其中所述方法进一步包括:将均值和协方差确定为跨训练数据的子集的运行均值和运行协方差。

3.根据权利要求1或2所述的方法(200),其中所述目标均值为零。

4.根据权利要求1至3中任一项所述的方法(200),其中所述目标协方差是单位协方差。

5.根据权利要求1至4中任一项所述的方法(200),其中编码器和解码器的参数的更新(280)进一步基于正则化项,所述正则化项惩罚与由目标均值和目标协方差定义的高斯概率分布的偏差。

6.根据权利要求5所述的方法(200),其中所述正则化项是基于kullback-leibler散度的损失项。

7.根据权利要求1至6中任一项所述的方法(200),其中所述解码器和/或所述解码器是神经网络。

8.根据权利要求1至7中任一项所述的方法(200),其中所述训练数据包括音频数据和/或图像...

【专利技术属性】
技术研发人员:F·施密特
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1