当前位置: 首页 > 专利查询>清华大学专利>正文

函数型数据中函数型主成分检验方法以及回归预测方法技术

技术编号:35933772 阅读:21 留言:0更新日期:2022-12-14 10:20
本申请公开一种函数型数据中函数型主成分检验方法以及回归预测方法。包括:获得函数型数据的标准函数型主成分,对于给定的一组基,设定原假设和备择假设;用B

【技术实现步骤摘要】
函数型数据中函数型主成分检验方法以及回归预测方法


[0001]本专利技术属于人工智能
,具体的说,涉及一种函数型数据中函数型主成分检验方法以及回归预测方法。

技术介绍

[0002]函数型数据分析特别适用于深入挖掘高速流动数据中所包含的知识,例如时间序列数据、温度的变化、人体身高变化、运动轨迹变化等,函数型数据分析包含了对有函数形式的数据进行的统计分析,Ramsay and Sliverman(2002,2005)提出了关于探索性工具,Ferraty and Vieu(2006)提出了巴拿赫空间或希尔伯特空间相关的结论,Hsing and Eubank(2015)提出了数据驱动的理论和方法。
[0003]函数型分析中必不可少的第一步是对均值函数和协方差函数的估计,过去十年间有大量参考文献对这部分内容进行了研究,如Degras(2011),Cao et al.(2012),Ma et al.(2012),Zheng et al.(2014),Gu et al.(2014),Cai et al(2020),Li and Yang(2022+)等构建了均值函数的同时置信带,而Cao et al.(2016),Wang et al.(2020),Zhong and Yang(2022+)等关于协方差函数构建了同时置信包络。
[0004]在对函数型数据进行挖掘时,函数型主成分分析是重要的。计算函数型主成分和函数型主成分得分的统计方法统称为函数型主成分分析。
[0005]许多有趣的应用研究都会将函数型主成分分析作为简化的初始步骤,例如Hall and Hosseini

Nasab(2006),Aue et al.(2015),Shang(2017)。通常,函数型主成分分析会计算协方差函数估计值的特征值和特征向量来得到函数型主成分,进而得到函数型主成分得分,见Ramsay andSilverman(2005),Horv
á
th and Kokoszka(2012),Shang(2014),Zhang et al.(2020)。然而这样的方法估计得到的函数型主成分和函数型主成分得分并没有显式的表达式,因此很难作为预测变量进行进一步的建模分析。

技术实现思路

[0006]为解决以上问题,本申请公开一种函数型数据中函数型主成分检验方法,用以检验函数型数据的标准函数型主成分是否等同于一组预先给定的基函数,包括如下步骤:
[0007]步骤S1:收集函数型数据,所述函数型数据包括观测的多个个体的轨迹函数,利用轨迹函数η
i
和测量误差构建观测值的数学模型;根据Karhunen

Loeve展开得到函数型主成分和函数型主成分得分,并根据轨迹变化的个体特征调整函数型主成分得分,获得调整后函数型主成分得分,以及标准函数型主成分;
[0008]步骤S2:对于给定的一组基,设定原假设和备择假设;
[0009]步骤S3:用B

样条方法对轨迹函数η
i
和均值函数m进行估计,进而得到代表第i个个体的轨迹变化的估计;
[0010]步骤S4,在原假设下,得到调整后函数型主成分得分的估计,并根据所述调整后函数型主成分得分的估计得到特征值的估计;
[0011]步骤S5:根据所述调整后函数型主成分得分的估计构建第一统计量根据第一统计量构建第二统计量根据第二统计量获得第二统计量的渐进性质S,并利用的分位数估计S的分位数Q1‑
α

[0012]步骤S6:构建检验统计量,根据检验统计量判断拒绝原假设还是接受原假设。
[0013]可选地,步骤S1中,利用所述轨迹函数η
i
和测量误差构建观测值的数学模型,利用所述数学模型获得标准函数型主成分,包括:
[0014]对函数型数据建立数学模型,记收集到的函数型数据中第i个个体特征的第j个观测值为Y
ij
,满足所述数学模型:
[0015]Y
ij
=η
i
(j/N)+σ
i
(j/N)∈
ij
,1≤i≤n,1≤j≤N
[0016]其中是测量误差,η
i
是第i个个体特征的轨迹函数,独立同分布于平方可积且连续的随机过程η,满足Eη(x)=m(x),Cov{η(x),η(x

)}=G(x,x

),其中x,x

∈[0,1],N表示有N个观测值,n表示有n个个体,
[0017]根据Mercer引理,存在协方差函数G(
·

·
)的特征值)的特征值和特征函数使得λ
k
表示第k个特征值,进而有Karhunen

Loeve展开:Loeve展开:其中称为函数型主成分;是一组均值为0,方差为1的不相关的随机变量,称为函数型主成分得分。所述数学模型改写为
[0018][0019]其中是的n组独立同分布的抽样,记代表第i个个体特征的轨迹变化,
[0020]记调整后函数型主成分得分为
[0021][0022]记特征函数为标准函数型主成分。
[0023]可选地,步骤S2中,对于给定的一组基设定原假设和备择假设,包括:
[0024]原假设:
[0025]H0:,对于所有特征值λ
k
>0且k≥1,有
[0026]备择假设:
[0027]H1:存在特征值λ
k
>0且k≥1,使得
[0028]其中,λ
k
表示第k个特征值;
[0029]λ
k

表示第k

个特征值;
[0030]表示所有等于λ
k
的特征值的下标k

对应的特征函数的集合;
[0031]表示所有等于λ
k
的特征值的下标k

对应的基函数{ψ
0,k

(
·
)}组成的集合。
[0032]可选地,步骤S3中,用B

样条方法对轨迹函数η
i
和均值函数m进行估计,进而得到代表第i个个体的轨迹变化的估计,包括:
[0033][0034][0035]是轨迹函数的估计;
[0036]是均值函数的估计;
[0037]g(j/N)是H
(p

2)
中的任意函数在j/N点上的取值;
[0038]H
(p

2)
是B样条函数张成的函数空间;
[0039]进而有
[0040][0041]是对ξ
i
(
·
)的估计。
[0042]可选地,步骤S4中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种函数型数据中函数型主成分检验方法,其特征在于,用以检验函数型数据的标准函数型主成分是否等同于一组预先给定的基函数,包括如下步骤:步骤S1:收集函数型数据,所述函数型数据包括观测的多个个体的轨迹函数,利用轨迹函数η
i
和测量误差构建观测值的数学模型;根据Karhunen

Loeve展开得到函数型主成分和函数型主成分得分,并根据轨迹变化的个体特征调整函数型主成分得分,获得调整后函数型主成分得分,以及标准函数型主成分;步骤S2:对于给定的一组基,设定原假设和备择假设;步骤S3:用B

样条方法对轨迹函数η
i
和均值函数m进行估计,进而得到代表第i个个体的轨迹变化的估计;步骤S4,在原假设下,得到调整后函数型主成分得分的估计,并根据所述调整后函数型主成分得分的估计得到特征值的估计;步骤S5:根据所述调整后函数型主成分得分的估计构建第一统计量根据第一统计量构建第二统计量根据第二统计量获得第二统计量的渐进性质S,并利用的分位数估计S的分位数Q1‑
α
;步骤S6:构建检验统计量,根据检验统计量判断拒绝原假设还是接受原假设。2.根据权利要求1所述的函数型数据中函数型主成分检验方法,其特征在于,步骤S1中,利用所述轨迹函数η
i
和测量误差构建观测值的数学模型,利用所述数学模型获得标准函数型主成分,包括:对函数型数据建立数学模型,记收集到的函数型数据中第i个个体特征的第j个观测值为Y
ij
,满足所述数学模型:Y
ij
=η
i
(j/N)+σ
i
(j/N)∈
ij
,1≤i≤n,1≤j≤N其中是测量误差,η
i
是第i个个体特征的轨迹函数,独立同分布于平方可积且连续的随机过程η,满足Eη(x)=m(x),Cov{η(x),η(x

)}=G(x,x

),其中x,x

∈[0,1],N表示有N个观测值,n表示有n个个体,根据Mercer引理,存在协方差函数G(
·
,
·
)的特征值λ1>λ2>

≥0,和特征函数使得λ
k
表示第k个特征值,进而有Karhunen

Loeve展开:Loeve展开:其中称为函数型主成分;是一组均值为0,方差为1的不相关的随机变量,称为函数型主成分得分,所述数学模型改写为其中是的n组独立同分布的抽样,记代表第i个个体特征的轨迹变化,记调整后函数型主成分得分为
记特征函数为标准函数型主成分。3.根据权利要求2所述的函数型数据中函数型主成分检验方法,其特征在于,步骤S2中,对于给定的一组基设定原假设和备择假设,包括:原假设:H0:,对于所有特征值λ
k
>0且k≥1,有备择假设:H1:存在特征值λ
k
>0且k≥1,使得其中,λ
k
表示第k个特征值;λ
k

表示第k

个特征值;表示所有等于λ
k
的特征值的下标k

...

【专利技术属性】
技术研发人员:宋泽宁杨立坚
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1