一种高维数据协同变化幅度识别方法及装置制造方法及图纸

技术编号：28145279 阅读：18 留言：0更新日期：2021-04-21 19:28

本文提供了一种高维数据协同变化幅度识别方法及装置，其中，方法包括：对高维数据样本进行预处理，得到数据矩阵X，其中，预处理包括：对齐高维数据的频率及填补高维数据的缺失值；利用抽样周期T0对数据矩阵X进行抽样处理，得到多个子数据矩阵X

全部详细技术资料下载

【技术实现步骤摘要】
一种高维数据协同变化幅度识别方法及装置

[0001]本文涉及数据分析领域，尤其涉及一种高维数据协同变化幅度识别方法及装置。

技术介绍

[0002]现有技术中存在较多的高维数据，例如声波阵列信号、强噪环境信号、金融数据及经济数据等，这些高维数据包含多个变量(也可称之为指标)，这些变量之间存在协同性变化，以经济数据(包含多个经济变量)为例，现有对经济数据协同性变化分析的主要实现方式为：利用Geweke、Sargent和Sims(1977)提出的动态因子模型(Dynamic Factor Model,DFM)从一系列宏观经济变量中提取出单一因子，以描述变量间的协同运动，从而解决了采用单一经济变量表示数据变化存在的局限性。但是，该方法仅能仅能处理频率相同的经济数据，且当分析数据的维度增加时，DFM模型将变得不稳定。伴随社会分工细化和经济活动多样化，经济数据的维度呈现出暴发增长，该分析方法难以精确的确定经济数据的协同变化幅度，进而使得利用经济数据协同变化幅度分析得到的经济周期、经济周期拐点判断不准确。

技术实现思路

[0003]本文用于解决现有技术中，对于高维数据的分析仅从中提取单一变量因子，用于表示高维数据中所有变量的协同变化，该种方法并不能精确地表示高维数据协同变化幅度的问题。
[0004]为了解决上述问题，本文的第一方面提供一种高维数据协同变化幅度识别方法，包括：
[0005]对高维数据样本进行预处理，得到数据矩阵X，其中，预处理包括：对齐高维数据的频率及填补金融数据的缺失值；
[...

【技术保护点】

【技术特征摘要】
1.一种高维数据协同变化幅度识别方法，其特征在于，包括：对高维数据样本进行预处理，得到数据矩阵X，其中，预处理包括：对齐高维数据的频率及填补高维数据的缺失值；利用抽样周期T0对数据矩阵X进行抽样处理，得到多个子数据矩阵X
i
；根据所有子数据矩阵X
i
，计算所述数据矩阵X的协方差矩阵估计V；对所述协方差矩阵估计V进行特征分解，得到特征向量Vx；将数据矩阵X在特征向量Vx方向进行投影，得到高维数据协同变化幅度。2.如权利要求1所述的方法，其特征在于，填补所述高维数据的缺失值，包括：利用如下公式填补所述高维数据的缺失值：E[Dt,j]＝Dt
‑
k,j，其中，Dt
‑
k,j为高维数据中j变量在采样时间t之前最近的数据记录，E[Dt,j]为高维数据中j变量在采样时间t的填充值，t
‑
k为最近的数据记录的采样时间。3.如权利要求1所述的方法，其特征在于，根据所有子数据矩阵X
i
，计算所述数据矩阵X的协方差矩阵估计V，包括：利用Newey
‑
West协方差矩阵调整方法，估计各子数据矩阵X
i
的协方差矩阵V
i
；对各子数据矩阵X
i
的协方差矩阵V
i
进行加权平均处理，将计算得到的平均值作为所述数据矩阵X的协方差矩阵估计V。4.如权利要求1所述的方法，其特征在于，对所述协方差矩阵估计V进行特征分解，得到特征向量Vx，包括：对所述协方差矩阵估计V进行特征分解，将最大特征值对应的特征向量作为特征向量Vx。5.如权利要求1所述的方法，其特征在于，还包括：对所述高维数据协同变化幅度按抽样周期T0进行抽样，得到...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：通联数据股份公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人