【技术实现步骤摘要】
利用深度状态空间模型的预测
[0001]本专利技术涉及一种使用机器学习来训练深度状态空间模型的计算机实现的方法,以及一种用于使用经训练的机器学习模型的相关联方法,一种被配置为使用机器学习来训练深度状态空间模型的装置,以及相关联的计算机程序元件,以及一种计算机可读介质。
技术介绍
[0002]数据驱动算法在技术系统中的开发和应用在技术系统的数字化中并且尤其是在技术系统的自动化中变得越来越重要。技术问题通常可以约简为获得关于至少一个时间序列的未来发展的最佳可能知识和/或信息,所述至少一个时间序列例如由至少一个传感器馈送。在技术系统中,一方面,评估新采集的数据点以生成新的数据点并且特别是针对至少一个时间序列的大量新数据点可能是有利的。例如,通过该方式,可以模拟和在统计上评估各种未来场景。然后,该技术系统可以根据基于所述至少一个时间序列的估计延续的模拟结果进行适配或重新配置。
[0003]例如,基于作为车辆的先前行驶路线的车辆路线预测、基于过去无线网络资源分配的未来无线网络资源分配、或者基于过去性能的未来工业机器性能都落入该 ...
【技术保护点】
【技术特征摘要】
1.一种用于使用机器学习来训练深度状态空间模型的计算机实现的方法,其中所述深度状态空间模型包括:生成模型和多模态推断模型,其中生成模型进一步包括转移模型()和发射模型(),转移模型被配置为描述多个潜在状态的改变,发射模型被配置为解码多个潜在状态从而提供多个合成观察,所述方法包括:接收(10)包括观察向量序列的训练数据集()的训练数据集,每个观察向量在观察步骤处获得;对于包含在观察向量序列中的多个观察向量,所述方法迭代b)、c)和d):b)通过对在观察向量序列的当前观察步骤处获得的当前观察向量进行映射以获得当前潜在状态的概率分布,使用多模态推断模型推断(11)来推断生成模型的当前潜在状态;c)使用多模态推断模型,将当前潜在状态的后验近似()构造(12)为混合密度网络,从而产生多个近似潜在状态向量;对于包含在观察向量序列中的多个观察向量:d)使用发射模型解码(13)所述多个近似潜在状态向量,从而提供多个合成观察;和e)输出(14)经训练的深度状态空间模型。2.根据权利要求1所述的计算机实现的方法,进一步包括:根据针对每次迭代计算的目标函数,通过将训练数据集的观察向量序列()与多个合成观察进行比较,迭代优化生成模型和多模态推断模型的参数。3.根据权利要求2所述的计算机实现的方法,其中目标函数是证据下界(ELBO)。4.根据权利要求2或3所述的计算机实现的方法,其中所述目标函数进一步包括基于对数证据的近似的第一正则化项()。5.根据权利要求2至4之一的计算机实现的方法,其中目标函数进一步包括基于对抗性函数的第二正则化项()。6.根据前述权利要求之一所述的计算机实现的方法,其中后验近似使用蒙特卡罗采样或随机化拟蒙特卡罗采样进行采样。7.根据前述权利要求之一所述的计算机实现的方法,其中将当前潜在状态的后验近似()构造为混合密度网络进一步包括:根据随机容积近似从先前的观察步骤采样后验近似。8.根据权利要求7所述的计算机实现的方法,其中通过构造最优分布在n维标准高斯上的个单位sigma点来生成随机容积近似,其中sigma点是与对应于观察步骤的潜在状态具有相同均值和协方差的样本。9.根据权利要求6至8之一所述的计算机实现的方法,其中加权函数()在每个时间步骤处被应用于后验近似的样本。10.根据权利要求9所述的计算机实现的方法,其中加权函数()是(i)从分类分布中采样的指标函数,或者(ii)加权函数包括被选择来实现最高似然性的非零分量。11.根据前述权利要求之一所述的计算机实现的方法,其中转移网络和/或混合分量由
门控循环单元(GRU)参数化。12.根据前述权利要求之一所述的计算机实现的方法,其中转移模型是非马尔可夫的。13.根据前述权利要求之一所述的计算机实现的方法,其中训练数据集包括定义时间序列训练序列的观察向量序列()。14.一种用于在预测系统中使用经训练的机器学习模型的计算机实现的方法,包括:
‑
接收(18)根据权利要求1
‑
13的方法生成的经训练的深度状态空间模型;
‑
接收(20)输入观察向量序列(),每个观察向量在观察步骤处获得;
‑
使用经训练的机器学习模型预测(22)观察向量序列()的至少一个延续,其中所述延续包括从经训练的机器学习模型获得的合成观察;和
‑
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。