为训练人工神经网络生成真实数据制造技术

技术编号:39255280 阅读:26 留言:0更新日期:2023-10-30 12:06
本发明专利技术涉及一种用于生成真实数据RD来训练人工神经网络的方法和设备。用于监控工业过程的合适且精确的人工神经网络的产生需要巨大量真实训练数据的可用性。本发明专利技术提出了通过用从残差数据的模型中提取的样本来增强这种过程的模拟数据SD来生成这种真实数据RD,其中残差数据表示在从真实过程收集的真实数据和在该真实过程的模拟中生成的模拟数据之间的差异。差异。差异。

【技术实现步骤摘要】
【国外来华专利技术】为训练人工神经网络生成真实数据


[0001]本专利技术涉及一种为训练人工神经网络生成真实数据的方法和设备。

技术介绍

[0002]现代深度学习方法已经被证明是强大的通用近似器,其可以学习解决各种各样的任务,包括图像分类、对象检测、自然语言翻译等。此外,深度学习模型还被训练来检测信号数据中的异常,例如出于质量控制目的在制造过程中捕获的异常。然而,经训练的深度神经网络的质量在很大程度上依赖于异类和标记的训练数据的量。普遍认为,如果模型的复杂性超过了训练样本的量,则该模型可能会过拟合,并且在新样本上表现不佳。
[0003]例如,在工业中,可用于训练异常检测模型的标记数据通常非常稀少。与工业领域相关的标记数据是昂贵的,并且需要领域知识来标记用于训练的这种数据。首先,为了收集异常数据,例如来自这种制造过程的异常数据,可能涉及破坏制造的工件以便收集异常观察,这可能是昂贵的,并且有时是不可能的。第二,即使异常数据可用,也需要特定领域的知识和经验来正确地标记和分类异常,使得(深度)机器学习模型可以首先学习复制人类决策,然后对新的、看不见的样本执行预测。本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的样本准备方法,用于生成数据的新样本S*来增强模拟数据SD,从而生成将被应用于训练数据评估模型DEM的真实数据其中

新样本S*基于从模型MOD采样的输出数据集ODS,

模型MOD是输入数据集IDS的模型,该输入数据集IDS的模型基于残差数据Z,其中残差数据Z基于真实过程的真实数据XR和对应于真实过程的模拟过程的模拟数据XS。2.根据权利要求1所述的方法,其中

为了生成模型MOD,在生成残差数据Z的模型MOD之前,对残差数据Z应用短时傅立叶变换(STFT),使得模型MOD的生成基于STFT变换的残差数据Z作为输入数据集IDS,

为了生成新样本S*,对从残差数据Z的模型MOD采样的输出数据集ODS应用相应的短时傅立叶逆变换(STFT
‑1),以生成新样本S*。3.根据权利要求2所述的方法,其中

为了生成模型MOD,在生成残差数据Z的模型MOD之前,对STFT变换的残差数据Z应用主分量分析(PCA),使得残差数据Z的模型MOD的生成基于STFT和随后的PCA变换的残差数据Z作为输入数据集IDS,

为了生成新的样本S*,在应用短时傅立叶逆变换(STFT
‑1)之前,对模型MOD的输出数据集ODS应用相应的逆主分量分析(PCA
‑1),使得对逆主分量分析(PCA
‑1)的输出应用短时傅立叶逆变换(STFT
‑1)。4.根据权利要求1至3中任一项所述的方法,其中,所述模型MOD基于多元高斯方法MVG生成的。5.根据权利要求4所述的方法,其中

为残差数据Z计算协方差矩阵CM,残差数据Z具有系数i和j的项CM
iij
=Cov(Z
i
,Z
j
),每个系数的范围从1到T,T表示残差数据Z的元素数量,以及

为了从如此生成的基于MVG的模型MOD(MVG)采样输出数据集ODS,从具有N
G
(0,CM)的相应建模的多元高斯分布中抽取随机样本RANDS。6.根据权利要求5所述的方法,其中

为了生成模型MOD,在计算残差数据Z之前,对真实数据XR和模拟数据XS执行预处理步骤PRE,尤其是下采样方法,以减少它们的数据量,从而产生DOWN(XR)和DOWN(XS),以及

对从多元高斯分布中抽取的随机样本RANDS执行相应的数据上采样步骤UP...

【专利技术属性】
技术研发人员:Y
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1