一种基于交叉注意力扩散模型的储层预测方法技术

技术编号:39797155 阅读:11 留言:0更新日期:2023-12-22 02:29
本发明专利技术提出一种基于交叉注意力扩散模型的储层预测方法,以生成式扩散模型为储层参数预测的基础,工区已有测井及取心资料作为数据支撑,结合

【技术实现步骤摘要】
一种基于交叉注意力扩散模型的储层预测方法


[0001]本专利技术涉及地质储层预测技术和深度学习
,尤其涉及一种基于交叉注意力扩散模型的储层预测方法


技术介绍

[0002]孔渗饱参数是描述储层物性的关键参数,它们直接影响储层中油气的储存和开发能力

因此,对储层进行高精度的储层参数预测具有重要意义,这是建立高精度地质模型

估算合理的油气储量以及确定有效开发方案的基础工作

[0003]目前针对储层预测研究,传统的预测方法主要包括基于曲线交会图的半定量分析以及简单的数学分析方法
(
主要包括优化判别参数的因子分析

贝叶斯判别分析以及聚类分析等
)
来拟合待预测参数

然而,这些传统方法多基于线性预测

效率较低且主观性较强,容易对储层参数的预测结果的准确性产生负面影响

同时,在实际测井过程中,由于储层复杂且非均质性强,测井数据可能受到噪声和异常值的影响,进一步影响对储层参数的预测效果

得益于深度学习的发展,基于数据驱动的思维方式为石油地质研究人员提供了全新的分析视角,这不仅可以降低分析成本,同时也可以提高对储层预测的准确性

[0004]扩散模型是一类生成式模型,在前向扩散过程中对输入数据逐步添加噪声,直至输入数据完全变成高斯噪声,而在反向逆扩散过程中,通过采样逐步进行去噪,学习如何从高斯噪声还原为真实的输入数据

然而,原始扩散模型是针对图像生成任务,不能直接应用于储层参数预测
。Transformer
网络拥有强大的特征提取能力,能较好地挖掘测井数据各特征之间的相关性

同时,交叉注意力机制通过计算原始数据与目标数据之间的交叉注意力,有利于捕获测井数据与储层参数之间的交互关系

因此,结合上述各模型网络的优点,构建由测井数据驱动的储层参数预测方法

[0005]本专利技术针对复杂测井响应特征,在测井数据的基础上,根据扩散模型的原理,提出了基于交叉注意力扩散模型的储层预测方法

该方法首先对测井数据进行异常值及标准化处理,避免模型在训练过程中学习到错误的信息

其次,利用1×1卷积模块分别将测井数据训练样本与其对应的真实储层参数映射到高维向量空间,以更好地区分不同的特征

再次,通过扩散模型中
Transformer
骨干网络提取高维向量空间中训练样本与真实储层参数加噪后的特征,并计算两者的交叉注意力,以预测当前时间步的噪声

最后,去噪模块迭代地进行去噪,得到最终预测的储层参数


技术实现思路

[0006]本专利技术主要是克服现有储层参数预测方法的不足之处,目的在于提供一种基于交叉注意力扩散模型的储层预测方法

[0007]为达到以上技术目的,本专利技术提供如下技术方案:
[0008]一种基于交叉注意力扩散模型的储层预测方法,其特征在于,包括以下步骤:
[0009]步骤
1、
获取工区已有的测井资料和取心资料:
[0010]获取工区已有的测井资料包括以下测井参数:自然伽马
(GR)、
声波时差
(AC)、
井径
(CAL)、
补偿中子
(CNL)、
补偿密度
(DEN)、
自然电位
(SP)、
电阻率测井值
(RT)
,应至少选择三种及以上的测井参数作为特征数据;工区已有取心资料作为标签数据,包括:孔隙度
(POR)、
渗透率
(PERM)
和含油饱和度
(SO)
,对于未取心工区,则需要预测该类储层参数

[0011]步骤
2、
对所获取的测井数据进行预处理,并构建训练和测试样本数据集:
[0012](1)
对所获取的测井数据进行预处理包括去除异常值及标准化处理,去除异常值采用鲁棒随机分割森林算法
(Robust Random Cut Forest,RRCF)
,包括以下步骤:
[0013]a)
给定包含
N
个样本点的测井数据集
X

{x1,x2,

,x
n
,

,x
N
}
,其中每个样本
x
i
的特征维数为
M。
首先选取前
n
个样本点
X


{x1,x2,

,x
n
}
初始化鲁棒随机分割树:计算
X

中所有样本在各特征维度
d
上的最大值和最小值根据概率分布随机选取一个特征维度
d
,其中在选取的特征维度
d
上采样分割值
C
,其概率分布为根据选取的特征维度
d
,将
X

分割成左子树
X
left

{x
i
|x
i
∈X

,x
id
≤C}
和右子树
X
right

X

\X
left
;在
X
left

X
right
中重复执行采样分割值
C
和分割子树的过程,直到
X

中的所有样本点均被分割到叶子结点上,且每个叶子结点仅包含一个样本点,最终由所有的
X
left

X
right
构成初始化的鲁棒随机分割树
T

[0014]b)
通过删除和插入样本点来计算异常评分

从第
n+1
个样本点开始,先删除
T
中第
x
i

n
个样本所属叶子结点的父结点,并用其兄弟结点代替,其中
i

n+1。
当删除样本点
x
i

n
时,模型复杂度的变化量,即
T
中所有叶子结点深度之和的变化值,为该点的异常程度

因此,样本点
x
i

n
的异常评分计算为:
[0015][0016]其中,函数
f
表示样本集
X...

【技术保护点】

【技术特征摘要】
1.
一种基于交叉注意力扩散模型的储层预测方法,其特征在于,包括以下步骤:
S1
:获取工区已有的测井资料和取心资料;
S2
:对所获取的测井数据进行预处理,并构建训练和测试样本数据集;
S3
:构建交叉注意力扩散模型网络结构;
S4
:将所述训练样本输入交叉注意力扩散模型进行训练;
S5
:根据所述步骤
S4
训练的交叉注意力扩散模型,对任意目标区域的储层参数进行预测;
S1、
所述步骤
S1
中获取工区已有的测井资料包括以下测井参数:自然伽马
(GR)、
声波时差
(AC)、
井径
(CAL)、
补偿中子
(CNL)、
补偿密度
(DEN)、
自然电位
(SP)、
电阻率测井值
(RT)
,应至少选择三种及以上的测井参数作为特征数据;工区已有取心资料作为标签数据,包括:孔隙度
(POR)、
渗透率
(PERM)
和含油饱和度
(SO)
,对于未取心工区,则需要预测该类储层参数
。S2、
所述步骤
S2
中对所获取的测井数据进行预处理包括去除异常值及标准化处理,去除异常值采用鲁棒随机分割森林算法
(Robust Random Cut Forest,RRCF)
,包括以下步骤:
S21
:给定包含
N
个样本点的测井数据集
X

{x1,x2,

,x
n
,

,x
N
}
,其中每个样本
x
i
的特征维数为
M。
首先选取前
n
个样本点
X


{x1,x2,

,x
n
}
初始化鲁棒随机分割树:计算
X

中所有样本在各特征维度
d
上的最大值和最小值根据概率分布随机选取一个特征维度
d
,其中在选取的特征维度
d
上采样分割值
C
,其概率分布为根据选取的特征维度
d
,将
X

分割成左子树
X
left

{x
i
|x
i
∈X

,x
id
≤C}
和右子树
X
right

X

\X
left
;在
X
left

X
right
中重复执行采样分割值
C
和分割子树的过程,直到
X

中的所有样本点均被分割到叶子结点上,且每个叶子结点仅包含一个样本点,最终由所有的
X
left

X
right
构成初始化的鲁棒随机分割树
T

S22
:其次,通过删除和插入样本点来计算异常评分

从第
n+1
个样本点开始,先删除
T
中第
x
i

n
个样本所属叶子结点的父结点,并用其兄弟结点代替,其中
i

n+1。
当删除样本点
x
i

n
时,模型复杂度的变化量,即
T
中所有叶子结点深度之和的变化值,为该点的异常程度

因此,样本点
x
i

n
的异常评分计算为:其中,函数
f
表示样本集
X

生成的
T
中任意一个叶子结点
y
的深度

异常评分
s(x
i

n
,X

)
越接近于0,
x
i

n
是异常样本点的可能性越小


T
中删除样本点
x
i

n
后,再将样本点
x
i
并至删除了
x
i

n
的集合
X

\{x
i

n
}
,得到新样本点集合
X

\{x
i

n
}∪{x
i
}。
重复执行鲁棒随机分割树的初始化过程,得到插入样本点
x
i
的鲁棒随机分割树
T


通过删除样本点
x
i

n
,其中
i

n+2
,计算并记录
x
i

n
的异常评分;
S23
:最后,迭代执行上述初始化鲁棒随机分割树,删除和插入样本点的过程,直到得到测井数据集
X
中所有样本点的异常评分
S

{s(x1),s(x2),

,s(x
N
)}
,将所有异常评分进行降序排列
S


Descending Sort(S)
,设定
S

中前2%的样本点为异常点,从
X
中剔除对应的样本点,得到去除异常值的测井数据集
X
new

对去除异常值的测井数据进行标准化处理,标准化方法为:对去除异常值的测井数据进行标准化处理,标准化方法为:对去除异常值的测井数据进行标准化处理,标准化方法为:其中
X

new
为标准化后的样本值,
μ

σ
分别为
X
new
的均值和标准差,
N

为去除异常值后测井数据的样本数量
。S24
:所述步骤
S2
中构建训练和测试样本数据集时,将预处理后的
80
%测井数据作为训练集
X
train
,剩余的
20
%测井数据作为测试集
X
test
。S3、
所述步骤
S3
中构建交叉注意力扩散模型网络结构,应包括以下模块:1×1卷积模块:卷积核数量设置为
c
,用于将输入的测井数据特征映射到高维空间中;加噪模块:在扩散过程中,对原始真实的储层参数
(
标签数据
)
逐步添加高斯噪声直到其完全变成纯高斯噪声为止;去噪模块:包含一个可学习的神经网络模型,在逆扩散过程中,通过预测当前时间步的噪声,并对当前时间步的状态进行去噪以获得前一时间步的状态;
Transformer
特征提取模块:采用编码器

解码器架构,编码器由层归一化,多头注意力层,前馈神经网络,神经元丢弃层
(Dropout)
及残差连接构成,解码器在编码器的基础上增加了一个交叉注意力层,其余组成部分与编码器相同;交叉注意力模块:由多头注意力层,层归一化及残差连接构成,其中多头注意力计算所需的键
(K)
和值
(V)
来源于编码器最后一层的输出,而查询
(Q)
来源于解码器前一次多头注意力的输出
。S4、
所述步骤
S4
中将所述训练样本输入交叉注意力扩散模型进行训练,包括以下步骤:
S41
:输入预处理后作为训练样本的测井数据到1×1卷积模块,其中
m
表示测井数据训练样本的数量,
d
表示测井数据的特征维度,通道数为1,经过
c
个1×1卷积后得到其嵌入向量即将测井数据的每个特征映射到高维空间中;
S42
:将嵌入向量
X
embedding
输入到
Transformer
特征提取模块的编码器中,对
X
embedding
中间层的所有神经元进行层归一化为
X
LN
:其中
E[
·
]
表示均值,
Var[
·
]
表示方差,
γ

β
分别是缩放和平移参数,
ε
为一极小值,防止出现分母为0的情况;将
X
LN
输入编码器的多头注意力层,首先构建矩阵向量
Q、K

V

Q

X
LN
W
Q
+b
Q
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)K

X
LN
W
K
+b...

【专利技术属性】
技术研发人员:武娟罗仁泽罗磊雷璨如
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1