当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于人工智能的数据预测方法及装置制造方法及图纸

技术编号:19240615 阅读:69 留言:0更新日期:2018-10-24 04:04
本发明专利技术公开了一种基于人工智能的数据预测方法及装置,方法包括:对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;根据各分量的频率选择预测模型的核函数,建立粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型;采用粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。装置包括:基于经验模态分解数据分解单元、数据预处理单元、基于最小冗余度最大相关性标准提取单元、最佳指标库单元、基于粒子群算法‑参数寻优的最小二乘支持向量机负荷预测单元、以及加权叠加单元。

【技术实现步骤摘要】
一种基于人工智能的数据预测方法及装置
本专利技术涉及数据挖掘
,尤其涉及一种基于人工智能的数据预测方法及装置,本专利技术基于历史数据时间序列对目标变量的变化趋势进行快速精确的预测。
技术介绍
数据预测是指基于大数据对事物发展趋势进行预先的估计。高效精确的数据预测是正确决策的依据和保证,许多行业和领域都会涉及预测问题,例如:预测某股票的未来价格,预测电力负荷变化趋势,预测某商品的未来销量以及行业趋势预测等。目前常用的单一预测方法可分为两类:传统预测方法和智能预测方法。其中,传统预测方法包括回归分析法、自回归滑动平均模型、灰色模型等。智能预测方法包括人工神经网络、支持向量机和模糊逻辑等。随着数据收集和数据存储技术的快速进步使得各组织机构可以大量获取各类数据,这为从不同维度预测某一行业或专业的变化趋势提供了数据支持。然而预测目标多维度化意味着预测环境的复杂化,采用单一的智能预测方法难以应对复杂环境给预测精度和效率带来的挑战,综合多种数据处理与智能预测的组合方法可以取得较好的预测精度和效率。
技术实现思路
本专利技术的目的在于提高数据预测的精度和效率,提供一种基于人工智能的数据预测方法及装置,为实现上述目的,本专利技术采用以下技术方案:一种基于人工智能的数据预测方法,所述方法包括以下步骤:利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量;对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;根据各分量的频率选择预测模型的核函数,建立粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型;采用粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。进一步地,所述对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集的步骤具体为:获取影响原始负荷时间序列变化的m个因素的数据;从各影响因素数据中取出对应原始负荷时间序列的n个数据元素,形成特征列向量;组合所述各影响因素特征数据,形成矩阵Fn×m;数据归一化处理组合后的所述数据矩阵;取矩阵的每一列为一个特征即可获得所述原始特征集Fm={x1,x2…xm},其中xm为特征。其中,所述方法将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。另一实施例,一种基于人工智能的电力负荷预测装置,所述装置包括:数据加工单元,用于异常数据点的辨识和修正;基于经验模态分解数据分解单元,用于分解预测目标的原始负荷时间序列;数据预处理单元,用于处理各影响因素特征数据,获得所述原始特征集;基于最小冗余度最大相关性标准提取单元,用于从所述原始特征集中提取最佳特征集最佳指标库单元,用于存放所述最佳特征集,作为下次预测参考;基于粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型预测单元,用于对所述各分量进行预测;加权叠加单元,用于叠加各分量负荷预测值得到最终预测结果。本专利技术提供的技术方案的有益效果是:1、本专利技术通过EMD(经验模态分解)将历史数据时间序列分解为IMF(本征模函数)分量和残差分量,然后用mRMR(最小冗余度最大相关性标准)从历史数据和影响因素数据中提取最优特征集作为预测模型的输入特征;2、本专利技术利用PSO-LSSVM(粒子群算法-参数寻优的最小二乘支持向量机)模型对每个分量进行预测,再通过加权叠加所有分量的预测值得到最终的预测结果;3、本专利技术将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。附图说明图1为本专利技术提供的一种基于人工智能的电力负荷预测方法的流程图;图2为本专利技术提供的EMD分解原始负荷时间序列示意图;图3为本专利技术提供的对各分量进行数据预处理形成各分量的原始输入特征集的流程图;图4为本专利技术提供的利用mRMR提取输入特征进行负荷预测的流程图;图5为本专利技术提供的各分量的输入特征数量不同时的预测误差示意图;图6为本专利技术提供的负荷预测结果示意图;图7为本专利技术提供的不同方法负荷预测结果对比图。图8为本专利技术提供的一种基于人工智能的数据预测装置的结构框图;图9为本专利技术提供的数据加工单元的结构框图;图10为本专利技术提供的数据预处理单元的结构框图;图11为本专利技术提供的基于mRMR提取最佳特征单元的结构框图;图12为本专利技术提供的分量imf5中特征mRMR值的降序排列图;具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面对本专利技术实施方式作进一步地详细描述。当前,组合预测方式可分为将多个单一预测模型的预测结果进行加权组合,以及将数据处理方法与智能预测方法相结合两类。本专利技术实施例将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。如图1所示,本实施例提供的一种基于人工智能的电力负荷预测方法,该方法包括:S11:获取原始负荷时间序列;S12:利用EMD将原始负荷时间序列分解成本征模函数(IMF)分量和残差分量;S13:对各分量进行数据预处理形成各分量的原始输入特征集;S14:运用mRMR从原始输入特征集中提取各分量的最佳输入特征集;S15:根据各分量的频率选择预测模型的核函数,建立PSO-LSSVM负荷预测模型;S16:采用PSO-LSSVM负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。其中,该步骤S11中的原始负荷时间序列主要是通过数据采集与监视控制系统(SCADA)或高级量测体系(AMI)获得的。在电力系统中,SCADA系统应用最为广泛,技术发展也最为成熟,它在远动系统中占重要地位,可以对现场的运行设备进行监视和控制,以实现数据采集、设备控制、测量、参数调节以及各类信号报警等各项功能,在现今的变电站综合自动化建设中起了相当重要的作用。其中,步骤S12,本实施例以我国某地电网2017年4月1日至6月30日2184h负荷时间序列的实际数据作为实验数据集输入EMD模型,通过EMD对原始负荷序列进行分解,如图2所示;EMD分解原始负荷时间序列具体包括:电力系统的原始负荷时间序列本身具有随机性,加之市场环境下复杂的负荷影响因素致使负荷序列更加不稳定,运用EMD进行负荷分解可获得更具规律性的分量,在对各分量分别建立预测模型,可提高预测精度。电力负荷可视为由若干个本征模函数(IMF)组成的一个时间序列。由IMF的定义知:IMF的每一个振动周期,只有一个振动模式,没有其他复杂的奇波。然而大多数所有要分析的数据都不是本征模函数,在任意时间点上,数据可能包含多个波动模式。利用EMD分解负荷时间序列需基于假设[1]:(1)待分解的复杂信号是由简单的IMF组成;(2)组成原始复杂信号的每一个IMF分量相互独立。基于上述分析,对给定的原始负荷时间序列进行分解的具体步骤如下:(1)找出原始负荷时间序列x(t)中所有局部极大值和局部极小值,并通过三次样条函数分别拟合x(t)的上包络线eup(t)和下包络线elow(t);(2)计算上包络本文档来自技高网...

【技术保护点】
1.一种基于人工智能的数据预测方法,其特征在于,所述方法包括以下步骤:利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量;对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;根据各分量的频率选择预测模型的核函数,建立粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型;采用粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。

【技术特征摘要】
1.一种基于人工智能的数据预测方法,其特征在于,所述方法包括以下步骤:利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量;对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;根据各分量的频率选择预测模型的核函数,建立粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型;采用粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。2.根据权利要求1所述的一种基于人工智能的数据预测方法,其特征在于,所述对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集的步骤具体为:获取影响原始负荷时间序列变化的m个因素的数据;从各影响因素数据中取出对应原始负荷时间序列的n个数据元素,形成特征列向量;组合所述各影响因素特征数据,形成矩阵Fn×m;数据归一化处理组...

【专利技术属性】
技术研发人员:孔祥玉李闯孔令桐郑锋
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1