一种基于动态联邦学习的储层识别方法技术

技术编号:37437844 阅读:10 留言:0更新日期:2023-05-06 09:09
本发明专利技术提出一种基于动态联邦学习的储层识别方法,主要涉及深度学习,石油勘探领域。主要步骤包含:确定实验井,进行数据预处理;设计基于联邦学习的储层识别方法,以借助目标井所在区块的周边区块中的储层样本,来训练一个具有高泛化性的领域预训练模型;设计动态加权融合策略,以解决区块间地质差异显著的问题;设计基于重加权的储层类别均衡方案,以解决储层类别不均衡的问题,从而提高储层识别的效果。本发明专利技术针对目标区块储层样本不足,借助联邦学习方法,使用周边区块储层样本识别目标井中储层类别,并对联邦学习方法进行优化,实现有效的储层识别。的储层识别。的储层识别。

【技术实现步骤摘要】
一种基于动态联邦学习的储层识别方法


[0001]本专利技术涉及地质资源勘探,深度学习,数据挖掘领域,具体涉及到一种基于动态联邦学习的储层识别方法。

技术介绍

[0002]储层识别是根据测井数据确定地层类别的工作,在石油勘探和开发中起着关键作用。传统的方法是用岩性评价和储层参数预测来识别储层,主要包括交叉图谱法和统计分析法。然而,其成本较高,同时借助专家经验易导致误差积累。油井的广泛部署为进一步了解地层创造了机遇和挑战。测井数据的复杂性使得储层识别越来越困难,因此迫切需要人工智能技术来提高工作效率和解释的合规性。
[0003]由于测井曲线数据的序列特性,储层识别是一项时间序列多分类任务。传统的机器学习方法已经成功地应用于储层识别和其他石油地质研究,包括人工神经网络、支持向量机、随机森林。然而,它们只适用于储层异质性较弱的情况。
[0004]在特征提取和模型泛化方面,深度学习比机器学习表现得更好。目前主要有两类储层识别方法:多井交叉验证法和邻井储层识别法。交叉验证法利用多口井来测试同一区块的另一口井,并重复这一过程,直到所有井都被测试过一次。基于邻井的储层识别方法是利用一口井来训练模型,然后用邻井进行测试。然而,以上方法都是使用专家标注的井训练模型,没有从根本上消除人工标注的错误,而经过油田实际开发验证的井数量较少,不足以支持模型训练。因此,急需设计出一种有效的储层识别方法。

技术实现思路

[0005]为解决现有技术中的缺点和不足,本专利技术目的为提出了一种基于动态联邦学习的储层识别方法;
[0006]本专利技术为实现上述的技术目的,采用如下的技术方案:
[0007]S1、选取经过油田实际开发验证的垂直井作为实验井,去除曲线异常值,以对测井曲线进行预处理;
[0008]S2、设计基于联邦学习的储层识别方法,以借助目标井所在区块的周边区块中的储层样本,来训练一个具有高泛化性的领域预训练模型;
[0009]S3、设计一种动态加权融合策略,解决区块间地质差异显著的问题;
[0010]S4、设计基于重加权的储层类别均衡方案,以解决储层类别不均衡的问题,从而提高储层识别的效果。
[0011]上述步骤S1中,通过井斜、曲线特征对井进行筛选,确定经过开发验证的实验井,实现数据的预处理。
[0012]上述步骤S2中,在构建基于联邦学习的储层识别方法时,具体包括:
[0013]考虑到目标区块样本不足,且周边区块经过油田开发验证的井也较少,因此借助联邦学习方法,将每个区块看作一个节点,每个区块用少数的实验井训练本地模型,训练好
的本地模型被上传到中心节点,借助动态加权策略进行模型融合,然后中心模型再被下发到各个区块进行训练,直到中心模型收敛,即得到一个高泛化性的初始模型作为领域预训练模型,以数据不动模型动的方式,在保护各区块数据安全的同时,实现多区块联合知识建模。最后使用目标区块的少量样本微调预训练模型,实现对目标测试井的储层识别。
[0014]上述步骤S3中,在设计一种动态加权融合策略时,具体包括:
[0015]S31、为了充分考虑各区块间显著的地质特征异质性,提出动态加权策略。在每一轮训练过程中,只有当模型的F1分数大于上一轮中心模型的F1分数时,该模型才会被上传至中心节点。各区块模型准确率权重α
i
、F1分数权重μ
i
、数据量权重v
i
计算公式如下:
[0016][0017][0018][0019]其中Acc
i
表示第i个区块的准确率,Size
i
则表示相应的F1分数和数据量。
[0020]S32、使用softmax函数对各个权重进行归一化,以融合各区块模型并更新中心模型F
θ
(x),公式如下:
[0021]w
i

softmax(α
i

i

i
)
[0022][0023]其中w
i
为第i个区块模型的融合权重,Aggrgate()为模型聚合函数,w
i
为相关参数。
[0024]上述步骤S4中,在设计基于重加权的储层类别均衡方案时,具体包括:
[0025]S41、受平滑准确率启发,尝试用F1分数作为损失函数的一部分。然而F1分数没有梯度,即无法用随机梯度下降的方法更新带有F1分数的损失。因此,首先为F1分数创建梯度:
[0026]F
g
=2yf
θ
(x)/(y+f
θ
(x))
[0027]S42、随机梯度更新过程如下:
[0028][0029]S43、将2/(y+f
θ
(x))作为缩放因子,则主要关注的样本梯度如下:
[0030][0031]S44、改进的损失函数F_Loss如下:
[0032]F_Loss=

(y(1

0.5F
g
)logf
θ
(x)+(1

y)
·
0.5F
g
·
log(1

f
θ
(x)))
[0033]使用1

0.5F
g
来平衡正样本的交叉熵,用0.5F
g
来平衡负样本的交叉熵。为了进一步解决长尾问题,对原有的CB_Loss平滑化,来避免有效样本为0的困境。最终的损失计算如
下:
[0034]CB=(1

β)/(1

β
s+1
)
[0035][0036]其中β是值为0.9999的超参数,s是每类样本的有效个数,则为第i个区块的训练数据和相关标签。
[0037]本专利技术的有益效果在于:一种基于动态联邦学习的储层识别方法,考虑储层数据样本量少,难以用于传统机器学习进行储层识别,因此借助动态联邦学习方法,通过动态加权融合策略、重加权储层类别均衡方案实现基于动态联邦学习的储层识别,在地质建模、石油勘探开发方面有重大的应用价值。
附图说明
[0038]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本专利技术基于动态联邦学习的储层识别的流程示意图。
[0040]图2为本专利技术基于动态联邦学习的储层识别的模型结构示意图。
具体实施方式
[0041]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态联邦学习的储层识别方法,其特征在于,具体步骤如下:S1、选取经过油田实际开发验证的垂直井作为实验井,去除曲线异常值,以对测井曲线进行预处理;S2、设计基于联邦学习的储层识别方法,以借助目标井所在区块的周边区块中的储层样本,来训练一个具有高泛化性的领域预训练模型;S3、设计一种动态加权融合策略,解决区块间地质差异显著的问题;S4、设计基于重加权的储层类别均衡方案,以解决储层类别不均衡的问题,从而提高储层识别的效果。2.根据权利要求1所述的一种基于动态联邦学习的储层识别方法,其特征在于,步骤S3中,设计一种动态加权融合策略来解决区块间地质差异显著的问题,主要包括:S31、为了充分考虑各区块间显著的地质特征异质性,提出动态加权策略。在每一轮训练过程中,只有当模型的F1分数大于上一轮中心模型的F1分数时,该模型才会被上传至中心节点。各区块模型准确率权重α
i
、F1分数权重μ
i
、数据量权重v
i
计算公式如下:计算公式如下:计算公式如下:其中Acc
i
表示第i个区块的准确率,Size
i
则表示相应的F1分数和数据量。S32、使用softmax函数对各个权重进行归一化,以融合各区块模型并更新中心模型F
θ
(x),公式如下:w
i

softmax(α
i
,μ
i
,ν
i
)其中w
i
为第i个区块模型的融合权重,Aggregate()为模型聚合函数,w
i
...

【专利技术属性】
技术研发人员:张卫山陈炳阳曾星杰曹绍华张宝宇
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1