基于多变量的加权组合模型的油气产量预测方法及系统技术方案

技术编号:35248493 阅读:25 留言:0更新日期:2022-10-19 09:56
本申请提供了一种基于多变量的加权组合模型的油气产量预测方法及系统,属于油气开发技术领域,基于多变量的加权组合模型的油气产量预测方法包括:获取生产数据,对生产数据进行预处理;建立门控循环单元神经网络预测模型,对门控循环单元神经网络预测模型进行训练和预测,得到第一预测值;建立多元回归模型,对多元回归模型进行训练和测试,得到第二预测值;计算权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;根据第一预测值、第二预测值和权重系数得出预测结果。通过本申请的技术方案,能够提高油气产量的预测精度。度。度。

【技术实现步骤摘要】
基于多变量的加权组合模型的油气产量预测方法及系统


[0001]本申请涉及油气开发
,具体而言,涉及一种基于多变量的加权组合模型的油气产量预测方法及系统。

技术介绍

[0002]我国作为能源消耗大国,近年来受工业化进程加快的影响,油气资源的消费需求不断增加。然而,国内油气供给却不足,对外依存度高。在国际政治大背景下,进一步加大油气井勘探力度,提高油气能源自给能力,对制定政策、发展规划至关重要。因此,找到有效的方法精准预测油气产量有着重要的实际意义。现阶段油气产量的预测模型主要集中在统计模型和机器学习模型上,各种单一模型较多,单一的统计模型和机器学习预测模型在反映数据信息上有限,对数据中的信息提取不够完整,预测精度还有提升空间。

技术实现思路

[0003]本申请旨在解决或改善单一模型预测效果精度低的问题。
[0004]为此,本申请的第一目的在于提供一种基于多变量的加权组合模型的油气产量预测方法。
[0005]本申请的第二目的在于提供一种基于多变量的加权组合模型的油气产量预测系统。
[0006]为实现本申请的第一目的,本专利技术第一方面的技术方案提供了一种基于多变量的加权组合模型的油气产量预测方法,包括:获取生产数据,对生产数据进行预处理,对预处理后的生产数据,划分出训练集和测试集;建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练;对测试集进行差分平稳处理;将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值;建立多元回归模型,将训练集作为输入对多元回归模型进行训练;将测试集作为输入对训练后的多元回归模型进行测试,得到第二预测值;计算权重系数,权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;根据第一预测值、第二预测值和权重系数得出预测结果。
[0007]根据本申请提供的基于多变量的加权组合模型的油气产量预测方法,首先获取生产数据,对生产数据进行预处理。对预处理后的生产数据,划分出训练集和测试集。然后建立门控循环单元神经网络预测模型,将训练集作为输入对门控循环单元神经网络预测模型进行训练。对测试集进行差分平稳处理,把测试集进行差分,转化成平稳的数据进行预测,预测效果较好,减轻了门控循环单元神经网络预测模型预测时间序列数据的滞后性。对于数据中的波动能较好的捕捉到。将差分平稳处理后的测试集作为输入,通过训练后的门控循环单元神经网络预测模型进行预测,得到第一预测值。建立多元回归模型,将训练集作为输入对多元回归模型进行训练,将测试集作为输入对训练后的多元回归模型进行测试,得
到第二预测值。多元回归模型对于数据中的波动可较好捕捉,可有效预测油气产量。然后通过算术平均法、误差方差加权平均、相对误差倒数法、最优加权或综合权重计算门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,根据第一预测值、第二预测值、门控循环单元神经网络预测模型权重系数和多元回归模型权重系数计算出预测结果。通过门控循环单元神经网络预测模型和多元回归模型加权组合预测油气产量,比多元回归模型和门控循环单元神经网络预测模型单一模型的预测精度高,预测效果较好。
[0008]另外,本申请提供的技术方案还可以具有如下附加技术特征:上述技术方案中,误差方差加权平均的计算公式为:;其中,为单一模型个数,表示第个单一模型,表示该模型在误差方差排序后的序号,为第个模型的权重。
[0009]在该技术方案中,误差方差加权平均方法在确定权重时是根据误差的方差大小来决定的。模型的权重与误差方差成反比,误差方差越大,权重就越小,误差方差越小,权重就越大。在确定模型权重时,首先计算各模型误差的方差,再对方差进行排序。通过误差方差加权平均计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
[0010]上述技术方案中,相对误差倒数法的计算公式为:;其中,为单一模型个数,为第个模型的相对误差,为第个模型的权重。
[0011]在该技术方案中,相对误差倒数法就是利用模型的相对误差来确定组合模型的加权权重,通过误相对误差倒数法计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
[0012]上述技术方案中,最优加权的计算公式为:;;其中,为权重向量,为单一模型个数,为误差矩阵,,为的转置矩阵,为误差平方和。
[0013]在该技术方案中,最优加权组合模型是根据某个优化原则构建目标函数,满足某
约束条件下的最优化问题。具体地,可以以组合模型的误差平方和为优化目标,在满足模型权重之和等于1的条件下,进行求解。通过最优加权计算门控循环单元神经网络预测模型的权重系数和多元回归模型的权重系数,预测精度高于单一多元回归模型和门控循环单元神经网络预测模型。
[0014]上述技术方案中,综合权重的计算公式为:;其中,是第个模型的最终权重,是第个模型用相对误差倒数法确定的权重,是第个模型用最优加权法确定的权重。
[0015]在该技术方案中,综合权重通过相对误差倒数法和最优组合两种确定权重的方法进行组合。相对误差倒数是一种非最优加权的方法,一定程度上来讲它是一种信息粗略加工组合,是从平均的角度组合多种模型,不能反应每个数据对模型的贡献。最优加权组合在理论上是最优的,但是也存在把误差放大的缺陷。所以把这两种选择权重的方法进一步组合,将会得到预测精度更高的模型。
[0016]上述技术方案中,生产数据包括自变量和因变量,自变量包括日返排液、套压、油压、输压、返排率和水气比,因变量包括日产气。
[0017]在该技术方案中,生产数据包括自变量和因变量,自变量包括日返排液、套压、油压、输压、返排率和水气比,因变量包括日产气。可以理解,在影响油气产量的因素中,可以选择累产气、日返排液、累排液、套压、油压、输压、返排率和水气比8个变量为影响变量,日产气作为预测变量。返排率是由日产气和累排液确定的,累产气和累排液只是日产气和日返排液的累加,所以选择返排率作为自变量,去掉累产气和累排液。最终,选出日返排液、套压、油压、输压、水气比和返排率这6个变量为输入变量。
[0018]上述技术方案中,基于多变量的加权组合模型的油气产量预测方法还包括:通过指标评价模型对第一预测值、第二预测值、预测结果进行评估,指标评价模型包括以下之一:均方误差、平均绝对误差和平均相对误差。
[0019]在该技术方案中,基于多变量的加权组合模型的油气产量预测方法还包括通过指标评价模型对第一预测值、第二预测值、预测结果进行评估。其中,指标评价模型包括均方误差、平均绝对误差或平均相对误差。具体地,多元回归模型和门控循环单元神经网络预测模型的五种加权组合模型的均方误差、平均绝对误差和平均相对误差均本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多变量的加权组合模型的油气产量预测方法,其特征在于,包括:获取生产数据,对所述生产数据进行预处理,对预处理后的所述生产数据,划分出训练集和测试集;建立门控循环单元神经网络预测模型,将所述训练集作为输入对所述门控循环单元神经网络预测模型进行训练;对所述测试集进行差分平稳处理;将差分平稳处理后的所述测试集作为输入,通过训练后的所述门控循环单元神经网络预测模型进行预测,得到第一预测值;建立多元回归模型,将所述训练集作为输入对所述多元回归模型进行训练;将所述测试集作为输入对训练后的所述多元回归模型进行测试,得到第二预测值;计算权重系数,所述权重系数包括门控循环单元神经网络预测模型权重系数和多元回归模型权重系数,所述权重系数的计算方法包括以下之一:算术平均法、误差方差加权平均、相对误差倒数法、最优加权和综合权重;根据所述第一预测值、所述第二预测值和所述权重系数得出预测结果。2.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述误差方差加权平均的计算公式为:;其中,为单一模型个数,表示第个单一模型,表示该模型在误差方差排序后的序号,为第个模型的权重。3.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述相对误差倒数法的计算公式为:;其中,为单一模型个数,为第个模型的相对误差,为第个模型的权重。4.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述最优加权的计算公式为:;;其中,为权重向量,为单一模型个数,为误差矩阵,,
为的转置矩阵,为误差平方和。5.根据权利要求1所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述综合权重的计算公式为:;其中,是第个模型的最终权重,是第个模型用相对误差倒数法确定的权重,是第个模型用最优加权法确定的权重。6.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述生产数据包括自变量和因变量,所述自变量包括日返排液、套压、油压、输压、返排率和水气比,所述因变量包括日产气。7.根据权利要求1至5中任一项所述的基于多变量的加权组合模型的油气产量预测方法,其特征在于,所述基于多变量的加权组合模...

【专利技术属性】
技术研发人员:郭翠平
申请(专利权)人:中国地质大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1