一种基于多源异构张量数据的组合碳排放预测模型制造技术

技术编号：37973360 阅读：9 留言：0更新日期：2023-06-30 09:48

本发明专利技术涉及污染物排放预测技术领域，具体的涉及一种基于多源异构张量数据的组合碳排放预测模型，包括以下步骤：数据收集，获取历年的碳排放数据；文本情感分析，为构建数值数据的张量信息空间做准备；张量表示，对数据进行预处理，构建起碳排放预测的信息空间，将预测信息表示为三阶张量流；张量分解与重构，使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值，捕捉不同信息模式之间的潜在关系，完成张量重构；碳排放组合预测，将预测结果进行加和得到未来碳排放量。将媒体信息与历史碳排放数据相结合，进行情感分析，结合搜索频次和历史碳排放量构建一个三维张量，以补充时间序列历史数据，避免有价值信息的遗失，提高预测性能。测性能。测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多源异构张量数据的组合碳排放预测模型

[0001]本专利技术涉及污染物排放预测
，具体的涉及一种基于多源异构张量数据的组合碳排放预测模型。

技术介绍

[0002]温室气体排放是世界各国一直在努力解决的问题。其目的旨在减少污染物排放并改善全球气候变暖情况。值得注意的是，碳排放是温室气体排放中的主要贡献者。因此，减少CO2排放是世界各国在治理温室气体时的首要关注点。对碳排放量进行预测可以帮助预测未来的全球变暖，估计减少二氧化碳的成本以及防止温度上升等相关好处。因此，探讨如何精准预测二氧化碳的排放量，在改善全球变暖和制定环境政策方面具有深远意义。
[0003]人们对碳排放量进行了多种预测，主要集中在应用时间序列模型进行。常见的时间序列统计模型，如ARIMA已被广泛用于碳排放预测。尽管人们对时间序列预测模型非常感兴趣，但它们只是基于历史值来预测碳排放。然而，碳排放是一个复杂的系统，它不仅受到过去信息的影响，还受到其他因素的影响，这些因素的影响很可能在未来的碳排放中显现出来。因此，如果忽略了它们的作用，可能会影响最终投影结果的可靠性和准确性。
[0004]近年来，研究人员广泛地将互联网数据作为解释变量纳入预测研究。多项研究表明，从用户生成内容中提取的信息可以有效地提高数值预测的准确性。由于它涵盖了即将发生的事件的信息，并可以提供时间序列历史数据的补充，因此可以有效地抵消由于缺乏对未来信息的了解而导致的预测性能的恶化。目前，这项技术已经被应用于评估标准监测，分析问题情况，天气和污染评估等领域。互联网...

【技术保护点】

【技术特征摘要】
1.一种基于多源异构张量数据的组合碳排放预测模型，其特征在于，包括以下步骤：步骤一：数据收集，通过关键词衡量网民对碳排放的关注程度，以及媒体对碳排放的关注指数，并获取历年的碳排放数据；步骤二：文本情感分析，对带有情感色彩的主观性文本进行分析、处理、归纳和推理，对感情色彩强弱程度赋值，将文本数据转换为数值数据，为构建数值数据的张量信息空间做准备；步骤三：张量表示，对数据进行预处理，结合上述获取的搜索频次、情感指数、历史碳排放量三类数据，将三类数据放置在三阶张量的三个不同面上，构建起碳排放预测的信息空间，保持数据的多面性和相互关联，将预测信息表示为三阶张量流，张量的每一阶表示信息模态的一个子空间；步骤四：张量分解与重构，使用高阶奇异值分解的方式将矩阵分解为奇异向量和奇异值，捕捉不同信息模式之间的潜在关系，将一个张量分解成一个核心张量，再乘以每个模式的矩阵，完成张量重构；步骤五：碳排放组合预测，采用“剩余补偿”思想构建RNN
‑
ARIMA组合预测模型，利用RNN对数据序列进行整体分析，用ARIMA解释RNN预测残差之间的线性关系，将两者预测结果进行加和得到未来碳排放量。2.根据权利要求1所述的基于多源异构张量数据的组合碳排放预测模型，其特征是：所述步骤一包括：步骤1
‑
1：从互联网上收集不同关键词的每日指数，将其作为搜索量指数用于衡量网民对碳排放的关注程度；步骤1
‑
2：从搜索数据库中检索与碳排放相关的新闻广播，并用关键词的出现频率作为媒体关注指数；步骤1
‑
3：从碳核算数据库获取历年的碳排放数据。3.根据权利要求2所述的基于多源异构张量数据的组合碳排放预测模型，其特征是：所述步骤二包括：步骤2
‑
1：根据互联网指数选取与“碳排放”相关性最强的关键词；步骤2
‑
2：以关键词为索引，从互联网博文和新闻网站标题中爬取相关文本内容；步骤2
‑
3：使用Python对所需文本内容进行爬取，通过使用基本情感词典对爬取的内容进行单词匹配，对情感进行分类，设置情感取值范围，确定情感的积极性；步骤2
‑
4：将文本内容分类，计算每日的情绪平均值，并获得每月情绪平均值。4.根据权利要求3所述的基于多源异构张量数据的组合碳排放预测模型，其特征是：所述步骤三包括：所述张量表示为：表示t时刻历史碳排放量与社交媒体信息之间的关系，分别代表搜索频次、情感指数、历史碳排放量的特征集合。5.根据权利要求4所述的基于多源...

【专利技术属性】
技术研发人员：徐小峰，曹晓溪，林若唯，刘文志，邓忆瑞，尹萌娟，陈优，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人