一种基于空间信息约束的数据驱动预测方法技术

技术编号:39801736 阅读:7 留言:0更新日期:2023-12-22 02:32
本发明专利技术属于智能信息处理技术领域,公开了一种基于空间信息约束的数据驱动预测方法

【技术实现步骤摘要】
一种基于空间信息约束的数据驱动预测方法、系统


[0001]本专利技术属于智能信息处理
,尤其涉及一种基于空间信息约束的数据驱动预测方法

系统


技术介绍

[0002]借助人工智能技术实现数据或信息处理与解释的自动化,甚至开展从数据出发实现对未知的探索性研究是当下的热点,也是全球数字化进程的重要引擎

但是,以深度学习为代表的人工智能技术,其成功的应用需要充足的数据样本做支撑,这使得许多在传统智能计算领域表现出色的方法无法在数据获取成本昂贵的专业研究领域大展身手

因为越专业的领域其数据获取成本越昂贵,导致其学习样本数据稀缺且缺少代表性

而且,在众多的研究领域中,如地球科学领域,其无论是经地表采集的或是从钻孔中获得的地球物理观测数据都具有空间性,并且,相应的研究目标无论是具象的地下岩层分布还是抽象出来的储层参数分布都是沿三维空间展布的

然而,现有的方法多针对的是结构化数据,对数据间的空间相关性考虑不足,比如,深度全连接神经网络将空间各采样点当成符合某种未知分布但不具空间相关性的孤立点来处理;卷积神经网络虽然在局部上考虑了预测目的的空间展布,但是其主要用于分类问题,如图像识别

图像分割等,而且其利用的空间相关信息受限于输入样本的大小,因此很难做到从全局考虑学习样本的空间相关性

以上这些在一定程度上制约了智能学习方法的推广

[0003]通过上述分析,现有技术存在的问题及缺陷为:现有的方法多针对的是结构化数据,对数据间的空间相关性考虑不足,这些在一定程度上制约了智能学习方法的推广


技术实现思路

[0004]针对现有技术存在的问题,本专利技术提供了一种基于空间信息约束的数据驱动预测方法

系统

[0005]本专利技术是这样实现的,一种基于空间信息约束的数据驱动预测方法,所述基于空间信息约束的数据驱动预测方法包括:
[0006]S1
:数据的获取及预处理;
[0007]S2
:基于同位协同克里金的预测目标插值;
[0008]S3
:基于序贯高斯模拟的样本权重求取及基于空间信息约束的损失函数的构建;
[0009]S4
:损失函数的优化及基于深度全连接神经网络的数据驱动预测

[0010]进一步,
S1
中数据的获取及预处理具体包括以下步骤:
[0011]S11
,针对研究对象的具体预测目标
Y
,获得多种采集方式不同的观测数据
X1,X2,

,X
n
,各观测数据的集合形式为:
[0012][0013]其中,
x
表示各数据集中的样本,
k
i
为第
i
个数据集的样本个数;
[0014]S12
,对观测数据进行中值填充的异常值处理;若各观测数据间的量纲相差
很大,则对其进一步做归一化处理,变换公式为:
[0015][0016]其中
x
norm
表示归一化后的样本,
x
max

x
min
分别为所述各观测数据的最大值和最小值;
[0017]S13
,对归一化后的
X1,X2,

,X
n

Y
进行正态变换,分别得到及
[0018]进一步,
S2
中基于同位协同克里金的预测目标插值具体包括以下步骤:
[0019]S21
,将与分别做相关性分析,确定与相关性最高的
[0020]S22
,以为主分量
Z1,以所述为次级变量
Z2,建立
Z1的插值公式:
[0021][0022]其中
α
i

β
为加权系数,
u
为空间位置向量,具体地,
u
o
表示待估计点的位置,表示采样点的位置,
n
为采样点的个数,也即
Y
的样本个数,
Z1(u
i
)
表示主分量在
u
i
处的取值,
Z2(u
o
)
表示次级变量在
u
o
处的取值;
[0023]S23
,基于无偏条件及最小方差条件,得到如下方程组:
[0024][0025]其中
C1、C2和
C
12
分别表示
Z1与
Z2的方差及协变差函数,具体的:
[0026][0027][0028]S24
,计算
Z1与
Z2的实验变差函数,并选择合适的变差函数模型对二者进行拟合,得到
γ1、
γ2;然后对所述
γ1、
γ2求取相应的协方差函数
C1、C2,求取公式为:
[0029]γ
(h)

C(0)

C(h)
[0030]其中,
h
表示距离

[0031]S25
,构建
Z1与
Z2的互相关函数
C
12
,即
[0032][0033]S26
,将所述的
C1、C2和
C
12
带入
S23
求得
S22
中的加权系数;
[0034]S27
,基于
S22
对主变量
Z1实现插值;
[0035]S28
,基于插值后的
(

Y

表示
)
及对应位置
u
建立点对
(x(u),y(u))
,其中
x(u)

[x1(u),x2(u),

,x
n
(u)]T
y(u)∈Y

,得到原始学习样本
m

min(k1,k2,

,k
n
)
为样本个数

[0036]进一步,
S3
中基于序贯高斯模拟的样本权重求取及基于空间信息约束的损失函数
的构建具体包括以下步骤:
[0037]S31
,对空间进行网格划分,并定义一条仅且只有一次经过所有未采样位置的随机路径;
[0038]S32
,按照随机路径在网格上顺序地随机游走,并沿随机路径对每个访问点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于空间信息约束的数据驱动预测方法,其特征在于,包括:
S1
:数据的获取及预处理;
S2
:基于同位协同克里金的预测目标插值;
S3
:基于序贯高斯模拟的样本权重求取及基于空间信息约束的损失函数的构建;
S4
:损失函数的优化及基于深度全连接神经网络的数据驱动预测
。2.
如权利要求1所述的基于空间信息约束的数据驱动预测方法,其特征在于,
S1
中数据的获取及预处理具体包括以下步骤:
S11
,针对研究对象的具体预测目标
Y
,获得多种采集方式不同的观测数据
X1,X2,

,X
n
,各观测数据的集合形式为:其中,
x
表示各数据集中的样本,
k
i
为第
i
个数据集的样本个数;
S12
,对观测数据进行中值填充的异常值处理;若各观测数据间的量纲相差很大,则对其进一步做归一化处理,变换公式为:其中
x
norm
表示归一化后的样本,
x
max

x
min
分别为所述各观测数据的最大值和最小值;
S13
,对归一化后的
X1,X2,

,X
n

Y
进行正态变换,分别得到及
3.
如权利要求1所述的基于空间信息约束的数据驱动预测方法,其特征在于,
S2
中基于同位协同克里金的预测目标插值具体包括以下步骤:
S21
,将与分别做相关性分析,确定与相关性最高的
S22
,以为主分量
Z1,以所述为次级变量
Z2,建立
Z1的插值公式:其中
α
i

β
为加权系数,
u
为空间位置向量,具体地,
u
o
表示待估计点的位置,表示采样点的位置,
n
为采样点的个数,也即
Y
的样本个数;;
Z1(u
i
)
表示主分量在
u
i
处的取值,
Z2(u
o
)
表示次级变量在
u
o
处的取值;
S23
,基于无偏条件及最小方差条件,得到如下方程组:其中
C1、C2和
C
12
分别表示
Z1与
Z2的方差及协变差函数,具体的:的方差及协变差函数,具体的:
S24
,计算
Z1与
Z2的实验变差函数,并选择合适的变差函数模型对二者进行拟合,得到
γ1、
γ2;然后对所述
γ1、
γ2求取相应的协方差函数
C1、C2,求取公式为:
γ
(h)

C(0)

C(h)
其中,
h
表示距离
。S25
,构建
Z1与
Z2的互相关函数
C
12
,即
S26
,将所述的
C1、C2和
C
12
带入
S23
求得
S22
中的加权系数;
S27
,基于
S22
对主变量
Z1实现插值;
S28
,基于插值后的
(

Y

表示
)
及对应位置
u
建立点对
(x(u),y(u))
,其中
x(u)

[x1(u),x2(u),<...

【专利技术属性】
技术研发人员:贺梅徐天吉智鹏鹏张广伟薛姣钟雨
申请(专利权)人:电子科技大学长三角研究院湖州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1