System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据采集成本预测模型训练方法和预测方法技术_技高网

一种数据采集成本预测模型训练方法和预测方法技术

技术编号:40359422 阅读:37 留言:0更新日期:2024-02-09 14:46
本申请涉及一种数据采集成本预测模型训练方法和预测方法,属于成本预测领域,其包括获取历史三维地震采集数据集,历史三维地震采集数据集包括X组数据,每组数据包括历史地震勘探工程中采集的历史参数和历史地震勘探工程对应的历史造价,其中,X为正整数;将X组数据分为N份训练数据集,N份训练数据集至少包括一组数据,任意两个训练数据集中至少包括一组不同的数据,其中,N为正整数;使用N份训练数据集训练得到N个初始模型;根据N个初始模型,确定采集成本预测模型。本申请具有提高地震数据采集成本预测的准确率的效果。

【技术实现步骤摘要】

本申请涉及成本预测的,尤其是涉及一种数据采集成本预测模型训练方法和预测方法


技术介绍

1、地震数据采集是油气地震勘探工程中第一道工序,也是最为重要的工序,数据采集的质量直接影响着后续地震资料处理和解释的质量,地震采集成本占地震勘探成本的80%以上。地震采集参数设计是地震数据采集前的一项重要工作,采集参数设计合理与否直接影响着采集数据的效果和地震数据采集工程造价。每个地质任务采集的参数是确定的,但是每个采集参数的取值是可以调整,并且基于任务的需求每个参数取值的调整都会影响其他参数的取值,所以参数的取值不同会使采集过程中的工程造价产生很大的差别。在确保满足地质任务要求的前提下,如何选择成本低的采集方案,是目前地震勘探工作亟待解决的问题。

2、目前,对采集成本的预测基本是在地震数据采集的不同阶段使用对应阶段的固定公式进行估算,再将各个阶段的估算成本进行相加。这种方式将地震数据采集的每个阶段完全割裂,没有考虑到各阶段之间的关联。

3、上述中的相关技术方案存在以下缺陷:地震数据采集的成本预测准确率低。


技术实现思路

1、为了改善地震数据采集的成本预测准确率低的问题,本申请提供了一种数据采集成本预测模型训练方法和预测方法。

2、在本申请的第一方面,提供了一种数据采集成本预测模型训练方法。该方法包括:获取历史三维地震采集数据集,历史三维地震采集数据集包括x组数据,每组数据包括历史地震勘探工程中采集的历史参数和历史地震勘探工程对应的历史造价,其中,x为正整数;将x组数据分为n份训练数据集,n份训练数据集至少包括一组数据,任意两个训练数据集中至少包括一组不同的数据,其中,n为正整数;

3、使用n份训练数据集训练得到n个初始模型;

4、根据n个初始模型,确定采集成本预测模型。

5、由以上技术方案可知,通过将历史三维地震采集数据集中的x组数据划分为n份训练数据集,并根据n份训练数据集分别进行训练,得到n个初始模型,根据n个初始模型确定采集成本模型,由于任意两份训练数据集中均包含不同的数据,所以得到的n个初始模型在一定程度上消除了由于数据划分导致的模型偏差,提高了初始模型的训练效果,进而提高了采集成本预测模型的预测准确率。

6、在一种可能的实现方式中,获取历史三维地震采集数据,还包括:

7、获取历史三维地震采集数据集,包括:

8、获取历史初始数据集;

9、将历史初始数据集中的非数值化数据转换为数值化数据,得到初始数值数据集;

10、将初始数值数据集中的数据进行异常值处理,得到初始标准数据集;

11、将初始标准数据集中的数据进行归一化处理,得到历史三维地震采集数据集。

12、由以上技术方案可知,通过对历史初始数据集中的数据进行数值化处理、异常值处理以及归一化处理,将历史初始数据集中的数据进行规范,避免由于数据不规范,数据异常等数据问题导致训练出的采集成本预测模型的准确度降低,为提高采集成本预测模型的预测准确度提供数据基础。

13、在一种可能的实现方式中,将初始数值数据集中的数据进行异常值处理,得到初始标准数据集,包括:

14、分析初始数值数据集中的数据,得到数据异常值;

15、将数据异常值赋值为空值;

16、对初始数值数据集中的空值进行缺失值填充,得到初始标准数据集。

17、由以上技术方案可知,将检测到的数据异常值重新进行填充,减少由于数据异常值导致训练得到的采集成本预测模型的准确率下架的问题,为训练采集成本预测模型提供良好的数据基础。

18、在一种可能的实现方式中,根据n个初始模型,确定采集成本预测模型,包括:获取n个初始模型的效果参数,效果参数表示初始模型的训练效果;

19、根据n个初始模型的效果参数,确定初始模型的最优超参数;

20、根据最优超参数和历史三维地震采集数据集,确定采集成本预测模型。

21、由以上技术方案可知,根据n个初始模型的效果参数,确定训练效果最好的初始模型,然后使用训练效果最好的初始模型的超参数即最优超参数来完成对采集成本预测模型的训练,在一定程度上保证了采集成本预测模型的训练效果,同时使用历史三维地震采集数据集训练采集成本预测模型,提高了采集成本预测模型的预测准确率。

22、在一种可能的实现方式中,方法还包括:使用灰狼优化算法对初始模型中的超参数进行优化。

23、由以上技术方案可知,通过使用灰狼优化算法对初始模型中的超参数进行优化,使得优化后的超参数更贴合地震采集数据的训练,提高了模型的学习性能,为得到采集成本预测模型提供了良好的模型基础。

24、在一种可能的实现方式中,使用灰狼优化算法对初始模型中的超参数进行优化,包括:

25、根据初始模型中的超参数,对灰狼的初始位置和搜索范围进行初始化;

26、设置搜索范围与迭代次数的关系函数,以使搜索范围随迭代次数产生非线性变化;

27、根据预设的最大迭代次数,对初始位置和搜索范围进行迭代,完成对超参数的优化。

28、由以上技术方案可知,通过让搜索范围进行非线性变化,可以平衡灰狼优化算法的局部搜索能力和全局搜索能力,实现对灰狼优化算法的优化性能的提升。

29、在一种可能的实现方式中,设置搜索范围与迭代次数的关系函数,包括:

30、x(i+1)=xp(i)-v·|h·xp(i)-x(i)|;

31、

32、

33、其中,x表示灰狼的位置向量,xp表示猎物的位置向量,i表示当前迭代次数,v和h表示系数向量,系数向量用于控制灰狼的搜索范围,r1、r2均为[0,1]区间的随机向量,maxiter表示最大迭代次数,a是收敛因子,收敛因子随当前迭代次数的变化产生非线性变化。

34、在一种可能的实现方式中,方法还包括:

35、计算每一次迭代中灰狼的位置向量对应的适应度分值;

36、根据适应度分值,计算每一个灰狼的比例系数;

37、根据灰狼的比例系数,确定下一次迭代中灰狼的位置向量。

38、在一种可能的实现方式中,根据灰狼的比例系数,确定下一次迭代中灰狼的位置向量包括:

39、

40、

41、其中,α、β、δ表示三种灰狼,fα、fβ、fδ分别表示不同灰狼对应的适应度分值,f1表示灰狼α对应的比例系数,f2表示灰狼β对应的比例系数,f3表示灰狼δ对应的比例系数,xα、xβ、xδ分别表示不同灰狼对应的位置向量。

42、在本申请的第二方面,提供了一种地震数据采集成本预测方法。该方法包括:

43、获取被测地震采集参数;

44、对被测地震采集参数做预处理,得到标准被测采集参数;

45、将标准被测采集参数输入至根据本申请的第一方面的方法训练得到的采集成本文档来自技高网...

【技术保护点】

1.一种数据采集成本预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述获取历史三维地震采集数据集,包括:

3.根据权利要求2所述的数据采集成本预测模型训练方法,其特征在于,所述将所述初始数值数据集中的数据进行异常值处理,得到初始标准数据集,包括:

4.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述根据所述N个初始模型,确定采集成本预测模型,包括:

5.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述方法还包括:使用灰狼优化算法对所述初始模型中的超参数进行优化。

6.根据权利要求5所述的数据采集成本预测模型训练方法,其特征在于,所述使用灰狼优化算法对所述初始模型中的超参数进行优化,包括:

7.根据权利要求6所述的数据采集成本预测模型训练方法,其特征在于,所述设置所述搜索范围与迭代次数的关系函数,包括:

8.根据权利要求6所述的数据采集成本预测模型训练方法,其特征在于,所述方法还包括:计算每一次迭代中所述灰狼的位置向量对应的适应度分值;

9.根据权利要求8所述的数据采集成本预测模型训练方法,其特征在于,所述根据所述灰狼的比例系数,确定下一次迭代中所述灰狼的位置向量包括:

10.一种地震数据采集成本预测方法,其特征在于,包括:

...

【技术特征摘要】

1.一种数据采集成本预测模型训练方法,其特征在于,包括:

2.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述获取历史三维地震采集数据集,包括:

3.根据权利要求2所述的数据采集成本预测模型训练方法,其特征在于,所述将所述初始数值数据集中的数据进行异常值处理,得到初始标准数据集,包括:

4.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述根据所述n个初始模型,确定采集成本预测模型,包括:

5.根据权利要求1所述的数据采集成本预测模型训练方法,其特征在于,所述方法还包括:使用灰狼优化算法对所述初始模型中的超参数进行优化。

【专利技术属性】
技术研发人员:苑益军吴功琛唐小东
申请(专利权)人:中国地质大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1