一种基于多源异构张量数据的组合碳排放预测模型制造技术

技术编号:37973360 阅读:9 留言:0更新日期:2023-06-30 09:48
本发明专利技术涉及污染物排放预测技术领域,具体的涉及一种基于多源异构张量数据的组合碳排放预测模型,包括以下步骤:数据收集,获取历年的碳排放数据;文本情感分析,为构建数值数据的张量信息空间做准备;张量表示,对数据进行预处理,构建起碳排放预测的信息空间,将预测信息表示为三阶张量流;张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,完成张量重构;碳排放组合预测,将预测结果进行加和得到未来碳排放量。将媒体信息与历史碳排放数据相结合,进行情感分析,结合搜索频次和历史碳排放量构建一个三维张量,以补充时间序列历史数据,避免有价值信息的遗失,提高预测性能。测性能。测性能。

【技术实现步骤摘要】
一种基于多源异构张量数据的组合碳排放预测模型


[0001]本专利技术涉及污染物排放预测
,具体的涉及一种基于多源异构张量数据的组合碳排放预测模型。

技术介绍

[0002]温室气体排放是世界各国一直在努力解决的问题。其目的旨在减少污染物排放并改善全球气候变暖情况。值得注意的是,碳排放是温室气体排放中的主要贡献者。因此,减少CO2排放是世界各国在治理温室气体时的首要关注点。对碳排放量进行预测可以帮助预测未来的全球变暖,估计减少二氧化碳的成本以及防止温度上升等相关好处。因此,探讨如何精准预测二氧化碳的排放量,在改善全球变暖和制定环境政策方面具有深远意义。
[0003]人们对碳排放量进行了多种预测,主要集中在应用时间序列模型进行。常见的时间序列统计模型,如ARIMA已被广泛用于碳排放预测。尽管人们对时间序列预测模型非常感兴趣,但它们只是基于历史值来预测碳排放。然而,碳排放是一个复杂的系统,它不仅受到过去信息的影响,还受到其他因素的影响,这些因素的影响很可能在未来的碳排放中显现出来。因此,如果忽略了它们的作用,可能会影响最终投影结果的可靠性和准确性。
[0004]近年来,研究人员广泛地将互联网数据作为解释变量纳入预测研究。多项研究表明,从用户生成内容中提取的信息可以有效地提高数值预测的准确性。由于它涵盖了即将发生的事件的信息,并可以提供时间序列历史数据的补充,因此可以有效地抵消由于缺乏对未来信息的了解而导致的预测性能的恶化。目前,这项技术已经被应用于评估标准监测,分析问题情况,天气和污染评估等领域。互联网数据和预测模型的结合可能会促进预测性能的提高,其中最主要的原因是文本挖掘对于识别想法和提取信息非常有用。
[0005]因此,现有的碳排放预测模型中往往忽略了互联网数据对碳排放的影响,本领域技术人员亟需一种能够解决当前问题的,并从用户生成内容中提取的信息从而有效地提高碳排放数值预测的准确性的碳排放预测模型。

技术实现思路

[0006]针对现有技术中存在的问题,本专利技术的目的在于:提供一种将互联网数据作为解释变量纳入碳排放预测研究,从用户生成内容中提取碳排放相关信息,有效地提高碳排放数值预测的准确性的基于多源异构张量数据的组合的碳排放预测模型。
[0007]为实现上述目的,本专利技术采用的技术方案是:一种基于多源异构张量数据的组合碳排放预测模型,包括以下步骤:步骤一:数据收集,通过关键词衡量网民对碳排放的关注程度,以及媒体对碳排放的关注指数,并获取历年的碳排放数据;步骤二:文本情感分析,对带有情感色彩的主观性文本进行分析、处理、归纳和推理,对感情色彩强弱程度赋值,将文本数据转换为数值数据,为构建数值数据的张量信息空间做准备;
步骤三:张量表示,对数据进行预处理,结合上述获取的搜索频次、情感指数、历史碳排放量三类数据,将三类数据放置在三阶张量的三个不同面上,构建起碳排放预测的信息空间,保持数据的多面性和相互关联,将预测信息表示为三阶张量流,张量的每一阶表示信息模态的一个子空间;步骤四:张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,将一个张量分解成一个核心张量,再乘以每个模式的矩阵,完成张量重构;步骤五:碳排放组合预测,采用“剩余补偿”思想构建RNN

ARIMA组合预测模型,利用RNN对数据序列进行整体分析,用ARIMA解释RNN预测残差之间的线性关系,将两者预测结果进行加和得到未来碳排放量。
[0008]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤一包括:步骤1

1:从互联网上收集不同关键词的每日指数,将其作为搜索量指数用于衡量网民对碳排放的关注程度;步骤1

2:从搜索数据库中检索与碳排放相关的新闻广播,并用关键词的出现频率作为媒体关注指数;步骤1

3:从碳核算数据库获取历年的碳排放数据。
[0009]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤二包括:步骤2

1:根据互联网指数选取与“碳排放”相关性最强的关键词;步骤2

2:以关键词为索引,从互联网博文和新闻网站标题中爬取相关文本内容;步骤2

3:使用Python对所需文本内容进行爬取,通过使用基本情感词典对爬取的内容进行单词匹配,对情感进行分类,设置情感取值范围,确定情感的积极性;步骤2

4:将文本内容分类,计算每日的情绪平均值,并获得每月情绪平均值。
[0010]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤三包括:所述张量表示为:表示t时刻历史碳排放量与社交媒体信息之间的关系,分别代表搜索频次、情感指数、历史碳排放量的特征集合。
[0011]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤四包括:步骤4

1:将t时刻的三阶张量分解为,其中C为核心张量,因子矩阵分别描述了经过高阶奇异值分解之后的搜索频次、情感指数、历史碳排放量三种预测信息的特征;步骤4

2:利用公式将核心张量和三个因子矩阵相乘,导出重构张量,其中,为运算符,分别代表搜索频次、情感指数、历史碳排放量的矩阵乘积,以避免信息重叠以及信息抵消导致的有价值信息的遗失。
[0012]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤五包括:步骤5

1:将重构张量数据流作为输入,利用公式,获得RNN在t时刻的隐藏状态,其中f是RNN的激活函数,U代表输入值的权重值,W代表隐藏值的权重值,b是隐藏值的偏置值;
步骤5

2:计算出当前时刻的隐藏状态后,在当前时刻的预测输出值的计算公式如下:,V是隐藏层到输出层的权重值,c是隐藏值的偏置值,计算出残差序列,其中为预测时间序列所对应的碳排放量真实值;步骤5

3:将残差序列作为ARIMA模型的输入,利用自回归模型进行自回归分析,运用残差至的状态变化来预测t时刻的残差,其中是常数,是自回归参数,p是自回归顺序,表示误差;步骤5

4:利用移动平均模型对自回归模型的误差部分进行累加,消除预测中相关因素因随机波动而形成的具有相互抵偿性的误差,其中,表示误差加和,λ表示与相关的期望,表示误差项,是移动平均参数,q是移动平均顺序;步骤5

5:自回归、移动平均两个子模型的集成定义了ARIMA模型的最终输出结果,公式为;步骤5

6:利用残差预测对RNN预测结果进行校正,得到组合预测结果的未来碳排量。
[0013]上述的基于多源异构张量数据的组合碳排放预测模型,所述步骤四与步骤五之间还包括:使用LSTM模型进行前期试验,了解社交媒体信息对碳排放预测的具体影响。
[0014]上述的基于多源异构张量数据的组合碳排放预测模型,所述前期试验包括:步骤a:基于将不同类型的数据作为输入的LSTM预测结果,分析搜索频率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源异构张量数据的组合碳排放预测模型,其特征在于,包括以下步骤:步骤一:数据收集,通过关键词衡量网民对碳排放的关注程度,以及媒体对碳排放的关注指数,并获取历年的碳排放数据;步骤二:文本情感分析,对带有情感色彩的主观性文本进行分析、处理、归纳和推理,对感情色彩强弱程度赋值,将文本数据转换为数值数据,为构建数值数据的张量信息空间做准备;步骤三:张量表示,对数据进行预处理,结合上述获取的搜索频次、情感指数、历史碳排放量三类数据,将三类数据放置在三阶张量的三个不同面上,构建起碳排放预测的信息空间,保持数据的多面性和相互关联,将预测信息表示为三阶张量流,张量的每一阶表示信息模态的一个子空间;步骤四:张量分解与重构,使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值,捕捉不同信息模式之间的潜在关系,将一个张量分解成一个核心张量,再乘以每个模式的矩阵,完成张量重构;步骤五:碳排放组合预测,采用“剩余补偿”思想构建RNN

ARIMA组合预测模型,利用RNN对数据序列进行整体分析,用ARIMA解释RNN预测残差之间的线性关系,将两者预测结果进行加和得到未来碳排放量。2.根据权利要求1所述的基于多源异构张量数据的组合碳排放预测模型,其特征是:所述步骤一包括:步骤1

1:从互联网上收集不同关键词的每日指数,将其作为搜索量指数用于衡量网民对碳排放的关注程度;步骤1

2:从搜索数据库中检索与碳排放相关的新闻广播,并用关键词的出现频率作为媒体关注指数;步骤1

3:从碳核算数据库获取历年的碳排放数据。3.根据权利要求2所述的基于多源异构张量数据的组合碳排放预测模型,其特征是:所述步骤二包括:步骤2

1:根据互联网指数选取与“碳排放”相关性最强的关键词;步骤2

2:以关键词为索引,从互联网博文和新闻网站标题中爬取相关文本内容;步骤2

3:使用Python对所需文本内容进行爬取,通过使用基本情感词典对爬取的内容进行单词匹配,对情感进行分类,设置情感取值范围,确定情感的积极性;步骤2

4:将文本内容分类,计算每日的情绪平均值,并获得每月情绪平均值。4.根据权利要求3所述的基于多源异构张量数据的组合碳排放预测模型,其特征是:所述步骤三包括:所述张量表示为:表示t时刻历史碳排放量与社交媒体信息之间的关系,分别代表搜索频次、情感指数、历史碳排放量的特征集合。5.根据权利要求4所述的基于多源...

【专利技术属性】
技术研发人员:徐小峰曹晓溪林若唯刘文志邓忆瑞尹萌娟陈优
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1