基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法技术

技术编号:36956821 阅读:26 留言:0更新日期:2023-03-22 19:17
本发明专利技术提供一种基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,属于页岩气开发领域。所述方法包括:确定影响目标区块页岩气产能的因素;其中,每个影响因素作为一个特征;根据确定的页岩气产能的影响因素获取页岩气数据构成特征数据集,并获取页岩气数据对应的产能构成标签数据集;利用特征数据集和标签数据集,建立基于卷积神经网络的产能预测模型;基于训练后的产能预测模型,计算特征数据集中每个特征的SHAP值,量化每个因素对产能的影响程度;基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素。采用本发明专利技术,能够对影响产能的因素进行重要性分析,提高了主控因素分析的准确率。提高了主控因素分析的准确率。提高了主控因素分析的准确率。

【技术实现步骤摘要】
基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法


[0001]本专利技术涉及页岩气开发领域,特别是指一种基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法。

技术介绍

[0002]页岩气特指赋存于页岩、泥岩、高碳泥岩和粉砂质岩类夹层中的非常规天然气。页岩气产能评价方法研究是对页岩气藏进行合理、高效开发的基础,产量影响因素分析是油气田开发中一项重要的任务,可以帮助开发者找到井在实际生产中的产量的主控因素,并获得更加深刻的理论认知。
[0003]传统分析主控因素的方法一般借助数值模拟开展,但对于复杂的问题,数值模拟无法考虑所有物理过程,进而影响主控因素分析结果的准确性。此外还可通过相关性分析方法分析主控因素,包括Pearson方法、Spearman方法和Kendall方法等。将不同的计算相关性的方法进行比较,Pearson适用于线性数据,使用时需要进行标准化,计算复杂度低,鲁棒性低;Spearman适用于线性数据和简单单调非线性数据,使用前需要标准化,计算复杂度低,鲁棒性为中等;Kendall与Spearman类似,适用于线性数据和简单单调非线性数据,使用前需要标准化,计算复杂度低,鲁棒性也是中等。

技术实现思路

[0004]本专利技术实施例提供了基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,能够对影响产能的因素进行重要性分析,提高了主控因素分析的准确率。所述方法包括:
[0005]确定影响目标区块页岩气产能的因素;其中,每个影响因素作为一个特征;
[0006]根据确定的页岩气产能的影响因素获取页岩气数据构成特征数据集,并获取页岩气数据对应的产能构成标签数据集;
[0007]利用特征数据集和标签数据集,建立基于卷积神经网络的产能预测模型;
[0008]基于训练后的产能预测模型,计算特征数据集中每个特征的SHAP值;
[0009]基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素。
[0010]进一步地,所述确定影响目标区块页岩气产能的因素包括:
[0011]从地质数据、工程数据和生产数据方面确定影响目标区块页岩气产能的因素;
[0012]其中,确定的影响目标区块页岩气产能的因素包括:裂缝导流能力evqual_p、厚度h、基质渗透率matrix_p、簇数cluster、裂缝半长half_length、入地液量liquid_volume、水平井长度well_length、饱和度S和生产压差pressure。
[0013]进一步地,第j个特征的SHAP值φ
j
表示为:
[0014][0015]其中,M为特征的数目,S为产能预测模型中特征的子集,f(S)为产能预测模型在特征子集S上的输出值,f(S∪{j})表示产能预测模型在特征子集S与第j个特征的并集上的输出值,j={1,...M},S表示S的大小,!表示阶乘。
[0016]进一步地,所述基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素包括:
[0017]基于得到的每个特征的SHAP值,利用单个产能影响因素的SHAP分析、总体特征概要分析、聚类SHAP分析和特征交互分析,分析产能与其影响因素之间的线性和非线性内在关系,确定目标区块的产能主控因素;
[0018]其中,单个产能影响因素的SHAP分析:通过计算每个影响产能的因素的平均绝对SHAP值,量化每个因素对产能的影响程度,对训练后的产能预测模型进行局部解释;
[0019]总体特征概要分析:以0为分界点表征特征对产能预测模型的输出的正负影响,并在量化完每个因素的影响程度后,通过排序,确定对产能影响较大的因素,实现对训练后的产能预测模型的全局解释;
[0020]聚类SHAP分析:将具有相似SHAP值的样本合并在一起并进行排序;
[0021]特征交互分析:分析不同特征之间的耦合非线性关系。
[0022]进一步地,第j个影响产能的因素的平均绝对SHAP值等于第j个特征的平均绝对SHAP值,表示为:
[0023][0024]其中,I
j
为第j个影响产能的因素的平均绝对SHAP值,具体为:特征数据集中所有样本的第j个特征的平均绝对SHAP值;φ
j
(x
i
)表示第i个样本的第j个特征的SHAP值,N表示特征数据集中样本的数目。
[0025]进一步地,总体特征概要分析,用于描述特征重要性和特征效应;其中,特征效应指:当第j个特征的平均绝对SHAP值大于0时,则表明第j个影响因素对产能预测模型的输出有正影响,当第j个特征的平均绝对SHAP值小于0时,则表明第j个影响因素对产能预测模型的输出有负影响。
[0026]进一步地,特征重要性是将各特征的平均绝对SHAP值I
j
作为对应特征的重要性度量标准,I
j
越大,则表明该特征越重要,确定所有特征的平均绝对SHAP值后,记为I=(I1,I2,...,I
M
),对I中的元素从大到小进行降序排序,排序越在前的特征对产能的影响越大;其中,I
j
为第j个特征的平均绝对SHAP值,M为特征的数目。
[0027]进一步地,通过计算两个特征之间的SHAP交互指数进行特征交互分析;其中,SHAP交互指数表示为:
[0028][0029]其中,φ
i,j
表示第i个特征和第j个特征之间的SHAP交互指数,M为特征的数量,S为产能预测模型中特征的子集,S表示S的大小,f(S)为产能预测模型在特征子集S上的输出值,f(S∪{j})表示产能预测模型在特征子集S与第j个特征的并集上的输出值,f(S∪{i})表示产能预测模型在特征子集S与第i个特征的并集上的输出值,f(S∪{i,j})表示产能预
测模型在特征子集S与第i,j个特征的并集上的输出值,!表示阶乘。
[0030]本专利技术实施例提供的技术方案带来的有益效果至少包括:
[0031]本专利技术实施例中,确定影响目标区块页岩气产能的因素;其中,每个影响因素作为一个特征;根据确定的页岩气产能的影响因素获取页岩气数据构成特征数据集,并获取页岩气数据对应的产能构成标签数据集;利用特征数据集和标签数据集,建立基于卷积神经网络的产能预测模型;基于训练后的产能预测模型,计算特征数据集中每个特征的SHAP值,量化每个因素对产能的影响程度;基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素。这样,通过深度学习算法与SHAP值,对影响产能的因素进行重要性分析,提高了分析的准确率,从而解决了传统主控因素分析方法准确性低、无法处理复杂问题、无法定量定性评价影响页岩气产能主控因素的问题。
附图说明
[0032]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,其特征在于,包括:确定影响目标区块页岩气产能的因素;其中,每个影响因素作为一个特征;根据确定的页岩气产能的影响因素获取页岩气数据构成特征数据集,并获取页岩气数据对应的产能构成标签数据集;利用特征数据集和标签数据集,建立基于卷积神经网络的产能预测模型;基于训练后的产能预测模型,计算特征数据集中每个特征的SHAP值;基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素。2.根据权利要求1所述的基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,其特征在于,所述确定影响目标区块页岩气产能的因素包括:从地质数据、工程数据和生产数据方面确定影响目标区块页岩气产能的因素;其中,确定的影响目标区块页岩气产能的因素包括:裂缝导流能力evqual_p、厚度h、基质渗透率matrix_p、簇数cluster、裂缝半长half_length、入地液量liquid_volume、水平井长度well_length、饱和度S和生产压差pressure。3.根据权利要求1所述的基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,其特征在于,第j个特征的SHAP值φ
j
表示为:其中,M为特征的数目,S为产能预测模型中特征的子集,f(S)为产能预测模型在特征子集S上的输出值,f(S∪{j})表示产能预测模型在特征子集S与第j个特征的并集上的输出值,j={1,...M},|S|表示S的大小,!表示阶乘。4.根据权利要求1所述的基于卷积神经网络与SHAP值的页岩气产能主控因素分析方法,其特征在于,所述基于得到的SHAP值,分析产能与其影响因素之间的内在关系,确定目标区块的产能主控因素包括:基于得到的每个特征的SHAP值,利用单个产能影响因素的SHAP分析、总体特征概要分析、聚类SHAP分析和特征交互分析,分析产能与其影响因素之间的线性和非线性内在关系,确定目标区块的产能主控因素;其中,单个产能影响因素的SHAP分析:通过计算每个影响产能的因素的平均绝对SHAP值,量化每个因素对产能的影响程度,对训练后的产能预测模型进行局部解释;总体特征概要分析:以0为分界点表征特征对产能预测模型的输出的正负影响,并在量化完每个因素的影响程度后,通过排序,确定对产能影响较大的因素,实现对训练后的产能预测模型的全局解释;聚类SHAP分析:将具有相...

【专利技术属性】
技术研发人员:岳明宋田茹朱维耀范琳宋洪庆潘滨
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1