一种用于实时污染数据预测的训练模型制造技术

技术编号:37719901 阅读:30 留言:0更新日期:2023-06-02 00:18
发明专利技术涉及一种用于实时污染数据预测的训练模型,其以LSTM作为基础模型,通过MAML加快LSTM收敛速度,减少LSTM模型数据集方面的限制。本发明专利技术达到的有益效果是:突破污染因子数据集数据量不够的限制,同时能够实现单一因子预测目标与多目标预测的平衡;该模型能够实现在保持预测准确度不降低的情况下,加速预测模型训练的作用;模型体量轻,在小样本数据集训练上的训练结果泛化性强。练上的训练结果泛化性强。练上的训练结果泛化性强。

【技术实现步骤摘要】
一种用于实时污染数据预测的训练模型


[0001]本专利技术涉及污染数据预测
,特别是一种用于实时污染数据预测的训练模型。

技术介绍

[0002]工业发展带来的大气污染排放量增加一直一来备受关注,治污降霾作为生态保护长期目标,实现从人工管理到数字管理不断发展,实现实时污染数据预测。
[0003]传统的污染数据实时预测的模型,是建立在特征互相独立的海量数据基础之上的。然而在实际生活中,污染因子时序数据的特征并非完全独立,由于我国数字化污染物检测起步较晚,导致的可获取有效环保数据十分有限。如何基于有限的环保数据,实现较高精度的预测,一直是一个难题。
[0004]本公司,提出基于LSTM的MAML深度学习训练模型结构,该模型体量轻,在小样本数据集训练上的训练结构泛化性强。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺点,提供一种用于实时污染数据预测的训练模型,解决了需要大样本才能精确预测的问题。
[0006]需要说明的是,污染因子的预测属于时序数据预测,时序数据预测的长短期记忆网络(Lon本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于实时污染数据预测的训练模型,其特征在于:包括以下步骤:S1、创建用于完成多因子污染物排放预测的主模型meta

model,初始化主模型meta

model中kernel参数;主模型中,可训练参数记作θ;S2、数据分组在数据预处理过程中,需要预先对数据进行清洗,即检测并擦除异常数据;采用拉格朗日多项式插值法补全数据;将补全后的数据分按比例分为训练组、测试组,又将训练组中数据按比例分为support data、query data,分别记作D
s
,D
q
;S3、考虑因子间的关联关系,同时处理多维因子;现对多维污染因子进行处理:S31、先获取数据:将训练组的support data与query data等比划分成n份;将第l个任务中(l=1
……
n,n表示有n个任务)进行预测所需的数据,分别记作D
sl
,D
ql
;S32、a、向主模型meta

model中输入数据D
sl
,输入模型,前向传递,计算得到预测值再取出步骤S2中实际测得的样本真实值;b、计算预测值与样本真实值的均方误差(MeanSquaredError),公式如下:其中,k表示污染因子维数,为任务l中污染因子第i维的真实值,为任务l中模型预测的第i维值;样本真实值为实际测得的值;c、为提高模型泛化能力,对模型权重参数采用L2正则化处理,L2正则误差公式如下:其中,其中λ为衰减系数,w
i
为模型中的第i个权重参数;误差总公式合并为:将该公式计算得出的误差记作d、根据D
sl
输入主模型meta

model得出的推理结果与样本真实值之间的误差,以链式法则反向传递,计算梯度则反向传递,计算梯度其中,y
l
代表任务l的污染因子真实值;e、根据先前的可训练参数θ、计算出的梯度以及学习率α,手动计算出优化后的模型参数θ',
其中,学习率α为经验值,即α的数值是根据经验来确定的;S4、建立子模型sub

model,结构与meta

model一致,用于处理任务中的另一部分输入数据:D
ql
,子模型sub

model的参数以手动优化后的meta

model模型参数作为其初始化参数;由于S3是针对第l个任务中的D
sl
数据进行的处理,故在S3基础上进一步处理;S41、构建任务l中的D
ql
输入数据所对应的子模型sub

model;该子模型sub

model以θ'作为参数,其余与主模型meta

model相同(主模型meta

model采用θ作为初始化参数);S42、a、向子模型sub

model输入任...

【专利技术属性】
技术研发人员:黄欣逸张伟揭小丽刘卫杰付瑶曾旭明
申请(专利权)人:成都之维安科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1