一种面向中长期预测模型的主成分分析方法技术

技术编号:31917878 阅读:12 留言:0更新日期:2022-01-15 13:00
本发明专利技术公开了一种面向中长期预测模型的主成分分析方法,涉及数据分析预测技术领域,通过收集研究对象的影响因素;根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析;若需要进行多重线性分析,则采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素,为关键影响因素的筛选提供数理依据。解决了现有目前对于主要影响因素的选择往往按照个人经验来确定,考虑不周的缺点。考虑不周的缺点。考虑不周的缺点。

【技术实现步骤摘要】
一种面向中长期预测模型的主成分分析方法


[0001]本专利技术属于数据分析预测
,尤其涉及一种面向中长期预测模型的主成分分析方法。

技术介绍

[0002]在研究分析工作中,常常需要针对关注的研究对象,收集大量相关影响因素,从而对其进行观测和分析。收集越多的影响因素就越方便全方面的对事物进行细致的研究,对深层次的规律进行探寻。但随着样本影响因素数量的增多,需要分析处理的数据量也是直线上升的,在进行样本聚类、回归等数据分析的过程中,样本的数据维度过大,无疑会使得问题的研究变得愈加复杂。目前对于主要影响因素的选择往往按照个人经验来确定,缺乏数理实证。且在考虑主因素时往往只考虑因素与研究对象之间的相关关系,而很少会考虑到各影响因素之间的相关关系是否会影响研究对象预测模型精度。

技术实现思路

[0003]本专利技术的目的在于提供一种面向中长期预测模型的主成分分析方法,从而解决了现有目前对于主要影响因素的选择往往按照个人经验来确定,考虑不周的缺点。
[0004]为实现上述目的,本专利技术提供了一种面向中长期预测模型的主成分分析方法,包括以下步骤:
[0005]收集研究对象的影响因素;
[0006]根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;
[0007]采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析;
[0008]若需要进行多重线性分析,则采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素。
[0009]优选地,根据基于熵权法的灰色关联分析判断所述影响因素与研究对象的关联度,包括以下步骤:
[0010]设定所述影响因素为指标,根据评价目的确定评价指标体系,根据所述评价指标体系收集所述指标的评价数据,根据所述指标和评价数据确定原始评价矩阵及参考数列;
[0011]对指标数据进行标准化处理,得到标准化序列;
[0012]从所述标准化序列中获取被研究对象比较序列,计算所述被研究对象比较序列与参考数列对应元素的绝对差值,并确定所述绝对差值的极值;
[0013]计算各被研究对象比较序列与参考数列对应元素的关联系数;
[0014]根据所述关联系数和指标计算关联度,具体的,采用熵权法对各个指标赋予权重,根据所述权重计算灰色加权关联度;
[0015]根据灰色加权关联度,得出综合评价结。
[0016]优选地,采用极差变换法进行标准化处理。
[0017]优选地,所述原始评价矩阵通过指标的指标值构建,参考数列由指标的最终值组成。
[0018]优选地,灰色加权关联度越大,研究对象与理想的比较标准越相似,评价结果越优,反之则越劣。
[0019]优选地,灰色加权关联度低于0.6的影响因素可以被剔除。
[0020]优选地,采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析,具体包括:
[0021]获取初步筛选后的影响因素之间的皮尔逊积矩相关系数;
[0022]当初步筛选后的影响因素之间的皮尔逊积矩相关系数高于0.6时需要进行多重共线性分析。
[0023]优选地,采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,具体包括:
[0024]计算初步筛选后各指标的方差扩大因子,判断各指标间的多重共线性程度,根据所述多重共线性程度对指标进行进一步筛选。
[0025]优选地,所述方差扩大因子VIF的计算公式为:
[0026][0027]上式中,R
i2
以自变量i为因变量时对其它自变量回归的复测定系数。
[0028]优选地,根据所述多重共线性程度对指标进行进一步筛选,具体包括:
[0029]根据初步筛选后的影响因素构建线性回归模型,当线性回归模型中存在多重共线性时,通过VIF值剔除变量。
[0030]与现有的技术相比,本专利技术具有如下有益效果:
[0031]本专利技术所提供的面向中长期预测模型的主成分分析方法,收集研究对象的影响因素;根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析;若需要进行多重线性分析,则采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素,为关键影响因素的筛选提供数理依据。解决了现有目前对于主要影响因素的选择往往按照个人经验来确定,考虑不周的缺点。
附图说明
[0032]为了更清楚地说明本专利技术的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一个实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是本专利技术一种面向中长期预测模型的主成分分析方法的流程图。
具体实施方式
[0034]下面结合本专利技术实施例中的附图,对本专利技术中的技术方案进行清楚、完整地描述,
显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0035]如图1所示,本专利技术所提供的面向中长期预测模型的主成分分析方法包括以下步骤:
[0036]S1、收集研究对象的影响因素;
[0037]S2、根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;
[0038]S3、根据初步筛选后的影响因素的皮尔逊积矩相关系数判断是否需要进行进一步的多重共线性分析;
[0039]S4、若需要进行多重共线性分析,采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素。
[0040]上述的面向中长期预测模型的主成分分析方法,通过收集研究对象的影响因素;根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析;若需要进行多重线性分析,则采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素,为关键影响因素的筛选提供数理依据。解决了现有目前对于主要影响因素的选择往往按照个人经验来确定,考虑不周的缺点。
[0041]其中一个实施例,根据基于熵权法的灰色关联分析判断所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向中长期预测模型的主成分分析方法,其特征在于,包括以下步骤:收集研究对象的影响因素;根据基于熵权法的灰色关联分析法计算所述影响因素与研究对象的关联度,根据所述关联度对所述影响因素进行初步筛选;采用皮尔逊积矩相关系数法对初步筛选后剩余的影响因素之间的关系进行分析,并判断是否要进行多重线性分析;若需要进行多重线性分析,则采用方差扩大因子的次因剔除法对初步筛选后的影响因素进行进一步筛选,以确定最终的主要影响因素,反之直接得到最终的主要影响因素。2.根据权利要求1所述的面向中长期预测模型的主成分分析方法,其特征在于,根据基于熵权法的灰色关联分析判断所述影响因素与研究对象的关联度,包括以下步骤:设定所述影响因素为指标,根据评价目的确定评价指标体系,根据所述评价指标体系收集所述指标的评价数据,根据所述指标和评价数据确定原始评价矩阵及参考数列;对指标数据进行标准化处理,得到标准化序列;从所述标准化序列中获取被研究对象比较序列,计算所述被研究对象比较序列与参考数列对应元素的绝对差值,并确定所述绝对差值的极值;计算各被研究对象比较序列与参考数列对应元素的关联系数;根据所述关联系数和指标计算关联度,具体的,采用熵权法对各个指标赋予权重,根据所述权重计算灰色加权关联度;根据灰色加权关联度,得出综合评价结。3.根据权利要求2所述的面向中长期预测模型的主成分分析方法,其特征在于,采用极差变换法进行标准化处理。4.根据权利要求2所述的面向中长期预测模型的主成分分析方法,其特征在于,所述原始评价矩阵通...

【专利技术属性】
技术研发人员:韩帅卢健斌郭小璇郭敏孙乐平
申请(专利权)人:广西电网有限责任公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1