基于多测量值的贝叶斯张量补全算法制造技术

技术编号:34177066 阅读:26 留言:0更新日期:2022-07-17 12:10
本发明专利技术提供一种基于多测量值的贝叶斯张量补全算法,将多测量值数据用多个张量表示,并设定张量的每个张量元素的每个测量值服从高斯分布;然后对张量进行CP分解,得到相应的因子矩阵,并设定因子矩阵的参数服从共轭先验分布;进而采用吉布斯抽样法对各参数的后验条件分布分别抽样,输出张量的估计值,基于张量的估计值对多测量值数据中的缺失值进行插值,从而实现数据补全。综上所述,本发明专利技术的补全方法针对于测量精度低、成本高且某些区域反复测量多次的测量数据,采用吉布斯抽样法结合CP分解实现数据补全,相比现有技术中的补全方法,由于本发明专利技术的方法可以利用全部测量数据的信息,因此能够提供更准确的估计值,从而实现更精确的数据补全。精确的数据补全。精确的数据补全。

【技术实现步骤摘要】
基于多测量值的贝叶斯张量补全算法


[0001]本专利技术属于张量补全
,具体涉及一种基于多测量值的贝叶斯张量补全算法。

技术介绍

[0002]张量是高维数组,是向量和矩阵的推广,可以用来表达具有复杂内在结构的多维数据。张量是真实世界高维数据的一个自然表达形式。比如,一个彩色图像可以看成一个三维张量,其中一维是颜色模式,另外两维是空间变量。一个由彩色图像组成的视频是四维的张量,第四个维度是时间变量。所以,目前张量分析是成为多维数据分析中的重要工具,并在许多领域都有应用,比如计算机视觉,数据挖掘,协同过滤。所以,基于张量分析的数据补全方法(张量补全方法)成为了张量分析中最活跃的领域。张量补全分方法试图对张量中的缺失数据或者没有观察到的数据进行插值。
[0003]在自然科学的一些情况下,有时测量技术并不准确。因此,固定某些变量,存在多个测量值。同样,某些区域没有被测量所以没有测量值。因为测量成本很高,对于没有测量区域的数值估计有重要意义。例如,在核物理领域的散射数据,三个维度分别是:原子核质量数,中子能量和角度。把数据离散化后,数据可以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多测量值的贝叶斯张量补全算法,其特征在于,包括以下步骤:步骤S1,将多测量值数据表示为若干个张量,并设置各个所述张量的张量元素的测量值服从高斯分布;步骤S2,采用CP分解法对所述张量进行分解得到多个因子矩阵,并计算多个所述因子矩阵的外积作为所述张量的估计值;步骤S3,将用于进行吉布斯抽样的各个参数的先验分布设置为共轭先验分布,并基于各个所述参数的所述先验分布求取各个所述参数的条件后验分布;步骤S4,采用吉布斯抽样法从各个所述参数的所述条件后验分布中进行抽样;步骤S5,判断是否达到预定的迭代次数,当判断为否时重复步骤S4;步骤S6,步骤S5判断为是时输出最终的所述张量的估计值,用于对所述多测量值数据中的缺失测量值进行插值,从而实现所述缺失测量值的补全。2.根据权利要求1所述的基于多测量值的贝叶斯张量补全算法,其特征在于:其中,步骤S1中,将所述多测量值数据表示为d维张量其中,步骤S1中,将所述多测量值数据表示为d维张量没有缺失值,包含有i个所述张量元素x
i
,其中i=(i1,

,i
d
),(1≤i
k
≤n
k
,k=1,

,d),部分的所述张量元素没有观测值,即有缺失值,其余可观测的所述张量元素具有l个观测值用一系列的所述张量表示所有的观测值,即所述多测量值数据,其中m=max(m
i
)对应于所有的i,所有的所述张量元素的第一个观测值被排列放在中,如果某个所述张量元素没有观测值,则在中对应的元素也为缺失,至同理,用一系列指示张量指示所述缺失值的情况,的元素为当i∈Ω
p
时,否则其中,Ω
p
代表观测到的元素的下标集合,步骤S2中,对的估计值进行分解:式中,是所述因子矩阵的第j列,符号代表外积。3.根据权利要求2所述的基于多测量值的贝叶斯张量补全算法,...

【专利技术属性】
技术研发人员:杨卫东王小航
申请(专利权)人:珠海复旦创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1