一种基于主成分分析的数据压缩迭代计算方法技术

技术编号:21630432 阅读:28 留言:0更新日期:2019-07-17 11:34
本发明专利技术提供了一种基于主成分分析的数据压缩迭代计算方法,用以解决现有技术中采用主成分分析方法对电力系统测量数据压缩导致计算量大的问题。所述数据压缩的主成分分析计算方法,通过迭代计算,使用前一次主成分分析数据压缩的特征向量矩阵来近似作为本次数据压缩的特征向量矩阵进行本次数据压缩,本次压缩是否可近似使用前一次的特征向量矩阵以重建数据精度为判定条件。本发明专利技术不需要很大的数据窗就可以提取出原始数据的相同特征,可显著提高数据压缩的效率和实时性;同时充分利用了电力系统测量数据之间的强相关性和关系一致性,实现了仅在扰动出现时重新计算一次、在扰动结束时再计算一次主成分分析数据压缩算法,显著减少了计算量。

An Iterative Method for Data Compression Based on Principal Component Analysis

【技术实现步骤摘要】
一种基于主成分分析的数据压缩迭代计算方法
本专利技术属于互联电网数据测量领域,具体涉及一种基于主成分分析的数据压缩迭代计算方法。
技术介绍
随着我国电网规模越来越扩大化,电力系统建设也在加速进行,电网的可靠稳定运行也越来越依赖大量信息的支持,同时海量信息的产生也给数据存储、传输造成了很大负担,尤其是随着电力系统广域测量、广域控制和保护等技术的迅速发展,大批新型装置被广泛应用于电力系统中。各种装置采集的大量数据需要进一步地研究分析,并加以利用,需要从数据采集中心通过电力通信网传送到上级管理中心。其中广域信息传递需要通过远程通信网,这种网络的传输速率通常要比近距离局域网的传输速率低,因此通信速度慢,传输所花费的时间长,很难满足电力系统通信的实时性要求;同时,电力系统中监测设备的数据采样率很高,所产生的大量数据形成数据通信和存储的瓶颈,严重影响到电力系统的稳定运行和安全控制。随着相量测量单元(PhasorMeasurementUnit,PMU)装置的普遍应用,产生的数据信息量越来越大,同时数据压缩技术在电力系统广域测量数据压缩领域的应用,越来越引起人们广泛关注和研究。如何对同步测量数据进行更可靠、稳定高效率的压缩和传输,具有重要的现实意义。现有技术中,用于数据压缩的主成分分析方法需要很大的数据窗来提供足够多的原始数据,以便于可以根据足够多的原始数据更加准确地且精确地提取出相同的特征。但是,大的数据窗显著地增加主成分分析方法的计算量,导致数据压缩的实时性差。同时,传统的主成分分析方法主要用于统计学,统计学中的随机变量通常是无序的,每次主成分分析的结果之间并没有显著的关联,并不完全适用于电力测量系统中具有很强相关性测量数据,不符合电力测量系统的实际数据特性。为了解决这些问题,本专利技术方法提出用于电力系统数据压缩的主成分分析方法的迭代计算过程及方法,相比于传统的主成分分析方法显著减少了计算量,可实现基于主成分分析的电力系统数据高效压缩。
技术实现思路
为了提高同步测量数据的压缩效率,克服主成分分析计算量大的问题,本专利技术提供了一种基于主成分分析的数据压缩迭代计算方法,充分利用电力系统测量数据之间的强相关性和关系一致性,通过迭代计算和判定条件的设定,不需要很大的数据窗就可以提取出原始数据的相同特征,可显著提高数据压缩的效率和实时性,减少计算量。为了实现上述目的,本专利技术采取了如下技术方案。一种基于主成分分析的数据压缩迭代计算方法,所述数据压缩计算方法包括如下步骤:步骤S0,根据待压缩的测量数据M个时刻的N组的相量序列,构建M行N列的原始数据矩阵Dr,归一化处理Dr得到数据矩阵D,根据C=DHD计算D的协方差矩阵C并进一步计算C的全部特征值λi,i=1......N,且λ1≥λ2≥…≥λN≥0,求线性方程组λiI-C=0的基础解系,得到C对于λi的一组特征向量ui,得到特征向量矩阵U=[u1,u2,…,uN],且满足UHCU=Λ,其中Λ=diag(λ1,λ2,…,λN),选择主成分分量数N′,通常选取的方法有累积贡献率方法和Kaiser-Guttman准则两种,根据主成分分量数N′从特征向量矩阵U中选取出前N′个特征向量构成压缩特征向量矩阵U′;Dr和D为M×N的复数矩阵,C和U为N×N的复数矩阵,U′为N×N′的复数矩阵;第n次数据压缩的压缩特征向量矩阵U′=[u1,u2,…,uN′]记为U′(n);步骤S1,令n=n+1,设当前为第n次数据压缩,则已知第n-1次数据压缩的压缩特征向量矩阵U′(n-1);步骤S2,把第n-1次数据压缩的压缩特征向量矩阵U′(n-1)作为第n次的压缩特征向量矩阵U′(n)的近似,即U′(n)=U′(n-1);计算第n次数据压缩的近似主成分矩阵P′(n),其计算公式为P′(n)=D(n)U′(n-1);再计算第n次数据压缩的重建数据矩阵步骤S3,计算用于判定重建数据精度的判别条件;步骤S4,判定U′(n)是否满足重建数据精度的判别条件,若判别条件成立,执行步骤S5;否则,转入步骤S8。步骤S5,满足重建数据精度的要求,不需要重新计算主成分分析过程;通过从1到N′的循环判断方法,判断是否更少的主成分分量ui和pi能满足重建数据精度的判别条件;若更少的ui和pi满足判别条件,则执行步骤S6,否则,执行步骤S7;步骤S6,设更新后的N′为通过循环判断得到的更少的主成分分量个数;则第n次数据压缩的压缩特征向量矩阵U′(n)为第n-1次数据压缩的压缩特征向量矩阵U′(n-1)的1到N′列,第n次数据压缩的主成分矩阵P(n)为近似主成分矩阵P′(n)的1到N′列,转入步骤S9;步骤S7,第n次数据压缩的压缩特征向量矩阵U′(n)等于第n-1次数据压缩的压缩特征向量矩阵U′(n-1),第n次数据压缩的主成分矩阵P(n)等于近似主成分矩阵P′(n),转入步骤S9;步骤S8,近似地将第n-1次数据压缩的压缩特征向量矩阵U′(n-1)作为第n次数据压缩的压缩特征向量矩阵U′(n)得到的重建数据矩阵不满足重建数据精度要求,需要计算一次全新的主成分分析,获得新的压缩特征向量矩阵U′(n)和新的主成分矩阵P(n),进入步骤S9;步骤S9,完成本次数据压缩,返回步骤S1进行下一次数据压缩。进一步地,所述步骤S1中的归一化处理,具体为:将Dr归一化为模值为1的归一化数据矩阵D,其计算公式为D=DrΛN-1,D为M×N的复数矩阵,其中1≤j≤N。进一步地,所述协方差矩阵C为Hermitian矩阵和半正定矩阵,则C的特征值λi均为实数。进一步地,所述步骤S3中用于判定重建数据精度的判别条件,采用综合矢量误差TVE值作为衡量重建数据精度的判别方法。进一步地,所述综合矢量误差TVE的值为,其中,是重构数据矩阵中的元素,Dij(n)是归一化的数据矩阵D(n)中的元素。进一步地,所述步骤S4中,所述判别条件为εTVE(n)<εTVE,MAX;其中,εTVE(n)为所有εij(n)的最大值,即取εTVE(n)=max{εij(n)};εTVE,MAX为数据压缩条件的综合矢量误差的最大值,εTVE,MAX的取值由实际需求设定。由上述本专利技术的实施例提供的技术方案可以看出,本专利技术实施例的基于主成分分析的数据压缩迭代计算方法,利用不同测量点的测量数据很强的一致性改进了基于主成分分析的数据压缩方法计算过程,通过迭代计算,使用前一次主成分分析数据压缩的特征向量矩阵来近似本次数据压缩的特征向量矩阵,在使用这种近似的基础上进行数据压缩;以重建数据精度为判定条件,判定是否可使用前一次的压缩特征向量矩阵近似地作为本次数据压缩的压缩特征向量矩阵,不需要很大的数据窗就可以提取出原始数据的相同特征,相比于传统主成分分析方法的数据窗长度具有显著优势,可显著提高数据压缩的效率和实时性;同时充分利用了电力系统测量数据之间的强相关性和关系一致性,实现了仅在扰动出现时重新计算一次、在扰动结束时再计算一次主成分分析数据压缩算法,相比于传统主成分分析数据压缩方法每次数据压缩都需要彻底地重新计算一遍主成分分析算法,本实施例的迭代计算过程计算量显著减少。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明为了更清本文档来自技高网
...

【技术保护点】
1.一种基于主成分分析的数据压缩迭代计算方法,其特征在于,所述数据压缩计算方法包括如下步骤:步骤S0,根据待压缩的测量数据M个时刻的N组的相量序列,构建M行N列的原始数据矩阵Dr,归一化处理Dr得到归一化数据矩阵D,根据C=D

【技术特征摘要】
1.一种基于主成分分析的数据压缩迭代计算方法,其特征在于,所述数据压缩计算方法包括如下步骤:步骤S0,根据待压缩的测量数据M个时刻的N组的相量序列,构建M行N列的原始数据矩阵Dr,归一化处理Dr得到归一化数据矩阵D,根据C=DHD计算D的协方差矩阵C并进一步计算C的全部特征值λi,i=1......N,且λ1≥λ2≥…≥λN≥0,求线性方程组λiI-C=0的基础解系,得到C对于λi的一组特征向量ui,得到特征向量矩阵U=[u1,u2,…,uN],且满足UHCU=Λ,其中Λ=diag(λ1,λ2,…,λN),选择主成分分量数N′,通常选取的方法有累积贡献率方法和Kaiser-Guttman准则两种,根据主成分分量数N′从特征向量矩阵U中选取出前N′个特征向量构成压缩特征向量矩阵U′;Dr和D为M×N的复数矩阵,C和U为N×N的复数矩阵,U′为N×N′的复数矩阵;第n次数据压缩的压缩特征向量矩阵U′=[u1,u2,…,uN′]记为U′(n);步骤S1,令n=n+1,设当前为第n次数据压缩,则已知第n-1次数据压缩的压缩特征向量矩阵U′(n-1);步骤S2,把第n-1次数据压缩的压缩特征向量矩阵U′(n-1)作为第n次的数据压缩特征向量矩阵U′(n)的近似,即U′(n)=U′(n-1);计算第n次数据压缩的近似主成分矩阵P′(n),其计算公式为P′(n)=D(n)U′(n-1);再计算第n次数据压缩的重建数据矩阵步骤S3,计算用于判定重建数据精度的判别条件;步骤S4,判定U′(n)是否满足重建数据精度的判别条件,若判别条件成立,执行步骤S5;否则,转入步骤S8。步骤S5,满足重建数据精度的要求,不需要重新计算主成分分析过程;通过从1到N′的循环判断方法,判断是否更少的主成分分量ui和pi能满足重建数据精度的判别条件;若更少的ui和pi满足判别条件,则执行步骤S6,否则,执行步骤S7;步骤S6,设更新后的N′为通过循环判断得到的更少的主成分...

【专利技术属性】
技术研发人员:张放严英王小君和敬涵许寅吴翔宇
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1