一种基于积流形的时空序列数据相似性度量方法及系统技术方案

技术编号:37575979 阅读:14 留言:0更新日期:2023-05-15 07:52
本发明专利技术提供一种基于积流形的时空序列数据相似性度量方法及系统,获取气象时空序列数据,形成包含时间、气象要素、高度、空间纬向和空间经向的五阶张量;对五阶张量进行降维,调整为包含时间、气象特征、空间纬向和空间经向的四阶张量;对四阶张量进行降维,获取包含空间纬向和空间经向的二阶矩阵;对二阶矩阵进行切比雪夫展开,获取包含切比雪夫系数数组的一阶向量;将所有一阶向量进行组合,得到三阶时序特征张量;通过格拉斯曼流形上的测地距离来度量两个不同时刻气象时空序列数据的相似性。本发明专利技术综合了积流形、基于切比雪夫多项式展开的降维两种主要方案,适应范围更广,对于特定应用领域的可解释性更好,而且无需训练,便于广泛应用。广泛应用。广泛应用。

【技术实现步骤摘要】
一种基于积流形的时空序列数据相似性度量方法及系统


[0001]本专利技术涉及数据处理
,特别是涉及一种基于积流形的时空序列数据相似性度量方法及系统。

技术介绍

[0002]目前,在很多应用领域中(比如空气质量预测、图像处理与计算机视觉等领域),都面临一个共性问题,即如何基于时空序列数据进行相似性度量,例如,对空气污染过程的相似性度量、气象过程的相似性度量、手势识别、动作识别等。而典型的时空序列数据X∈R
T
×
P
×
M
×
N
是一个四阶张量,各阶分别对应时间、特征通道、空间行、空间列。因此,如何对这样一个高阶张量进行有效地可解释的相似性度量,一直以来都是一个很大的挑战。
[0003]此外,部分现有文献也容易忽略张量的几何结构,也缺乏对多因子情况和多个特征通道的一般情况的考虑,导致现有文献的效果和适应范围有限;而且基于张量分解的降维方法对于特定应用领域(比如空气质量预测)的可解释性也并不明确。同时,当前广泛应用的神经网络与深度学习,在空气质量预测、图像处理与计算机视觉等应用领域方面,也存在可解释性差、需要海量标定样本这两方面的缺陷,从而限制了其在上述应用领域的深入应用。

技术实现思路

[0004]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于积流形的时空序列数据相似性度量方法及系统,用于解决现有方案中在对时空序列数据进行相似性度量时的问题。
[0005]为实现上述目的及其他相关目的,本专利技术提供一种基于积流形的时空序列数据相似性度量方法,包括以下步骤:
[0006]获取气象时空序列数据,并根据所述气象时空序列数据形成包含时间、气象要素、高度、空间纬向和空间经向的五阶张量;
[0007]将所述气象要素和所述高度合并为气象特征,并对所述五阶张量进行降维,将所述五阶张量调整为包含时间、气象特征、空间纬向和空间经向的四阶张量;
[0008]从所述四阶张量中获取一个时间片的单个气象特征,并基于所获取的单个气象特征对所述四阶张量进行降维,获取包含空间纬向和空间经向的二阶矩阵;
[0009]对所述二阶矩阵进行切比雪夫展开,获取包含切比雪夫系数数组的一阶向量;
[0010]根据所述切比雪夫系数数组形成空间特征,并将所有气象特征和对应时间片计算结果的一阶向量进行组合,得到包含空间特征、气象特征和时间的三阶时序特征张量;
[0011]将所述三阶时序特征张量表征为格拉斯曼流形,并通过格拉斯曼流形上的测地距离来度量两个不同时刻气象时空序列数据的相似性。
[0012]可选地,对所述二阶矩阵进行切比雪夫展开前,所述方法还包括:获取二维切比雪夫多项式
[0013]其中,为x方向上的一维切比雪夫多项式,ψ
s
(j)为y方向上的一维切比雪夫多项式;I0表示x方向上的格点数,J0表示y方向上的格点数;k为x方向上一维切比雪夫多项式的阶数,s为y方向上一维切比雪夫多项式的阶数。
[0014]可选地,所述一维切比雪夫多项式的递推公式为:
[0015]可选地,对所述二阶矩阵进行切比雪夫展开,获取包含切比雪夫系数数组的一阶向量的过程包括:
[0016]在二维等距网格上定义函数Z(i,j),i=1,2,

,I0;j=1,2,

,J0;
[0017]利用二维切比雪夫多项式对所对定义的函数Z(i,j)进行拟合,得到拟合函数有:
[0018][0019]对所述二阶矩阵进行二维等距网格上的切比雪夫展开,获取切比雪夫系数A
ks
,有:
[0020][0021][0022][0023]将获取的所有切比雪夫系数组合为一维数组,得到包含切比雪夫系数数组的一阶向量;
[0024]式中,K0为x方向上切比雪夫多项式的截止阶数,0为y方向上切比雪夫多项式的截止阶数;μ
k
为x方向上切比雪夫多项式的模,v
s
为y方向上切比雪夫多项式的模。
[0025]可选地,通过格拉斯曼流形上的测地距离来度量两个不同时刻气象时空序列数据的相似性的过程包括:
[0026]获取两个不同时刻的气象时空序列数据;
[0027]根据其中一个时刻的气象时空序列数据得到三阶时序特征张量X,以及根据另外一个时刻的气象时空序列数据得到三阶时序特征张量Y;
[0028]对所述三阶时序特征张量X按阶展开,得到对应的三个展开矩阵;以及对所述三阶时序特征张量Y按阶展开,得到对应的三个展开矩阵;其中,每个展开矩阵对应一个格拉斯曼因子流形;
[0029]根据每个展开矩阵所对应的格拉斯曼因子流形,计算所述三阶时序特征张量X和所述三阶时序特征张量Y中相互对应的因子子空间之间的相关角;
[0030]对计算出的相关角进行升序排列,得到对应的相关角向量;
[0031]在格拉斯曼积流形中对所有的相关角向量进行融合,计算出所述三阶时序特征张
量X和所述三阶时序特征张量Y的弦距离,并将所述弦距离作为两个不同时刻的气象时空序列数据的相似性。
[0032]可选地,所述方法还包括:
[0033]对所述三阶时序特征张量X按阶展开,得到X
(1)
∈R
T
×
(M
×
N)
、X
(2)
∈R
M
×
(T
×
N)
和X
(3)
∈R
N
×
(T
×
M)
这三个展开矩阵;
[0034]对所述三阶时序特征张量Y按阶展开,得到Y
(1)
∈R
T
×
(M
×
N)
、Y
(2)
∈R
M
×
(T
×
N)
和Y
(3)
∈R
N
×
(T
×
M)
这三个展开矩阵;
[0035]根据每个展开矩阵所对应的格拉斯曼因子流形,采用奇异值分解SVD计算所述三阶时序特征张量X和所述三阶时序特征张量Y中,两两相互对应的因子子空间之间的相关角,有:
[0036][0037]其中,对角阵Λ的对角元素按降序排列;
[0038]根据第j维的奇异值λ
j
,得到第j维的相关角θ

j
,其中,λ
j
=cosθ

j
;式中,λ
j
≥0,0≤θ

j
≤π/2;
[0039]对第j维的相关角θ

j
按升序排列,得到对应的相关角向量θ
i
,i=1,2,3;
[0040]在格拉斯曼积流形中对所有的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于积流形的时空序列数据相似性度量方法,其特征在于,包括以下步骤:获取气象时空序列数据,并根据所述气象时空序列数据形成包含时间、气象要素、高度、空间纬向和空间经向的五阶张量;将所述气象要素和所述高度合并为气象特征,并对所述五阶张量进行降维,将所述五阶张量调整为包含时间、气象特征、空间纬向和空间经向的四阶张量;从所述四阶张量中获取一个时间片的单个气象特征,并基于所获取的单个气象特征对所述四阶张量进行降维,获取包含空间纬向和空间经向的二阶矩阵;对所述二阶矩阵进行切比雪夫展开,获取包含切比雪夫系数数组的一阶向量;根据所述切比雪夫系数数组形成空间特征,并将所有气象特征和对应时间片计算结果的一阶向量进行组合,得到包含空间特征、气象特征和时间的三阶时序特征张量;将所述三阶时序特征张量表征为格拉斯曼流形,并通过格拉斯曼流形上的测地距离来度量两个不同时刻气象时空序列数据的相似性。2.根据权利要求1所述的基于积流形的时空序列数据相似性度量方法,其特征在于,对所述二阶矩阵进行切比雪夫展开前,所述方法还包括:获取二维切比雪夫多项式其中,为x方向上的一维切比雪夫多项式,ψ
s
(j)为y方向上的一维切比雪夫多项式;I0表示x方向上的格点数,J0表示y方向上的格点数;k为x方向上一维切比雪夫多项式的阶数,s为y方向上一维切比雪夫多项式的阶数。3.根据权利要求2所述的基于积流形的时空序列数据相似性度量方法,其特征在于,所述一维切比雪夫多项式的递推公式为:4.根据权利要求2或3所述的基于积流形的时空序列数据相似性度量方法,其特征在于,对所述二阶矩阵进行切比雪夫展开,获取包含切比雪夫系数数组的一阶向量的过程包括:在二维等距网格上定义函数Z(i,j),i=1,2,

,I0;j=1,2,

,J0;利用二维切比雪夫多项式对所对定义的函数Z(i,j)进行拟合,得到拟合函数有:对所述二阶矩阵进行二维等距网格上的切比雪夫展开,获取切比雪夫系数A
ks
,有:,有:,有:
将获取的所有切比雪夫系数组合为一维数组,得到包含切比雪夫系数数组的一阶向量;式中,K0为x方向上切比雪夫多项式的截止阶数,0为y方向上切比雪夫多项式的截止阶数;μ
k
为x方向上切比雪夫多项式的模,v
s
为y方向上切比雪夫多项式的模。5.根据权利要求4所述的基于积流形的时空序列数据相似性度量方法,其特征在于,通过格拉斯曼流形上的测地距离来度量两个不同时刻气象时空序列数据的相似性的过程包括:获取两个不同时刻的气象时空序列数据;根据其中一个时刻的气象时空序列数据得到三阶时序特征张量X,以及根据另外一个时刻的气象时空序列数据得到三阶时序特征张量Y;对所述三阶时序特征张量X按阶展开,得到对应的三个展开矩阵;以及对所述三阶时序特征张量Y按阶展开,得到对应的三个展开矩阵;其中,每个展开矩阵对应一个格拉斯曼因子流形;根据每个展开矩阵所对应的格拉斯曼因子流形,计算所述三阶时序特征张量X和所述三阶时序特征张量Y中相互对应的因子子空间之间的相关角;对计算出的相关角进行升序排列,得到对应的相关角向量;在格拉斯曼积流形中对所有的相关角向量进行融合,计算出所述三阶时序特征张量X和所述三阶时序特征张量Y的弦距离,并将所述弦距离作为两个不同时刻的气象时空序列数据的相似性。6.根据权利要求5所述的基于积流形的时空序列数据相似性度量方法,其特征在于,所述方法还包括:对所述三阶时序特征张量X按阶展开,得到X
()
∈R
...

【专利技术属性】
技术研发人员:余游王华斌陈李封雷
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1