【技术实现步骤摘要】
通过构建运行数据典型工况样本库提高预测精度的方法
本专利技术属于热工技术和人工智能交叉
,具体涉及一种通过构建运行数据典型工况样本库提高预测精度的方法。
技术介绍
随着电力行业信息化的不断深入,火力发电厂采集的数据量越来越多,多元线性回归、神经网络和支持向量机等技术的发展,为数据资源的开发和应用提供了重要的理论基础。利用电站运行数据对发电过程参数进行预测与估计,可以为电站设备的状态监测及机组的安全优化运行提供模型基础。在利用运行数据构建发电过程参数模型时,模型预测精度对所选取数据样本的工况特性具有较强的依赖性。随意地选取数据样本很难获得机组全部的运行工况信息,而若把所有的运行数据全用来建立模型,则需要处理巨大的数据量,还会带来信息的冗余,从而降低预测精度。因此,本专利技术考虑从大量的运行数据中选择其中的一部分具有代表性的工况样本,构建典型工况样本库,使其涵盖大部分运行工况,以此来表征过程特性,在建立模型时既不影响计算效率,又能保证模型的预测精度。
技术实现思路
为了解决上述问题,本专利技术提供一种通过构建运行数据典型工况样本库提高预测精度的方法,所述方法利用相关 ...
【技术保护点】
通过构建运行数据典型工况样本库提高预测精度的方法,所述方法利用相关分析消除冗余变量,利用主成分分析进行降维,以工况信息量指标最大为目标,搜寻给定数量的运行数据样本,构建典型工况样本库,使其涵盖大部分运行工况,以此来表过程特性,在建立模型时既不影响计算效率,又能保证模型的预测精度。
【技术特征摘要】
1.通过构建运行数据典型工况样本库提高预测精度的方法,所述方法利用相关分析消除冗余变量,利用主成分分析进行降维,以工况信息量指标最大为目标,搜寻给定数量的运行数据样本,构建典型工况样本库,使其涵盖大部分运行工况,以此来表过程特性,在建立模型时既不影响计算效率,又能保证模型的预测精度。2.根据权利要求1所述的方法,其特征在于,所述方法包括:步骤1):对运行数据进行相关性分析,若存在相关变量,则选择其中的1个变量作为代表,去除冗余变量信息;步骤2):利用主成分分析对剩余的变量进行降维,用提取后的主成分变量代替原变量,得到降维后的数据;步骤3):在降维后的数据里,搜索给定数量的数据样本,使样本的工况信息量指标最大,得到样本索引序列;步骤4):根据步骤3)得到的序列,从步骤1)未降维的数据中选取序列对应的工况样本,即构成典型工况样本库;步骤5):根据步骤4)所构建的工况样本库数据建立的模型,进行结果预测。3.根据权利要求2所述的方法,其特征在于,步骤1)中所述相关性分析去除冗余变量方法具体包括以下步骤:步骤1.1):计算运行数据中任意两个变量的相关系数;步骤1.2):如果存在变量的相关系数大于0.95,则取其中的1个变量代替其他变量;步骤1.3):重复执行步骤1.1)-步骤1.2),直至任意两个变量相关系数小于0.95,表明数据中不存在冗余的相关变量。4.根据权利要求2所述的方法,其特征在于,步骤2)中所述运行数据降维采用的是主成分分析方法,具体包括以下步骤:步骤2.1):对p维变量n个运行数据,构成样本矩阵X∈Rn×p,所述X∈Rn×p是n×p维矩阵,并进行标准化使各列变量样本的均值为0,方差为1;步骤2.2):根据上述步骤2.1)构成的样本矩阵得出矩阵的协方差步骤2.3):根据步骤2.2)得出的协方差Σ,得出协方差的特征根λ1≥λ2≥...
【专利技术属性】
技术研发人员:吕游,黄鑫,杨婷婷,刘吉臻,
申请(专利权)人:华北电力大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。