地震初至训练集生成方法及装置制造方法及图纸

技术编号:35975818 阅读:23 留言:0更新日期:2022-12-17 22:44
本发明专利技术提供了一种地震初至训练集生成方法及装置,涉及油气勘探开发技术领域,该方法包括:获取样本池信息和基准模型信息;利用样本池信息和基准模型信息生成预测信息;计算预测信息的信息熵数据和分类数据;根据信息熵数据和分类数据确定地震初至训练集。本发明专利技术可以利用信息熵数据和分类数据,在样本池信息中自动筛选更具有代表性和最具有价值的样本数据,进而得到更优质的地震初至训练集,以便提高智能拾取的工作效率和精度。能拾取的工作效率和精度。能拾取的工作效率和精度。

【技术实现步骤摘要】
地震初至训练集生成方法及装置


[0001]本专利技术涉及油气勘探开发
,尤其是涉及一种地震初至训练集生成方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]地震数据的初至走时可以构建近地表结构信息,有助于改善静校正、地震成像和储层反演精度。地震数据的初至拾取是地震资料处理中最基础和非常耗时的一项工作,对于复杂地区低信噪比海量数据的初至拾取问题,常规方法如能量比法、相关法、分形维数法等基于单一规则设计,抗噪差,自动拾取结果精度低,拾取结果依赖人工编辑,而人工拾取多则耗时几个月。智能拾取方法如基于全卷积神经网络的初至拾取法能够直接在地震波形数据上学习初至波固有特征,初至拾取结果精度高,抗噪性强。该类方法需要初至时间已知的样本作为学习范本,标签样本类型越多,模型学习效果越好,标签样本的数量和质量决定了初至拾取的精度和效率。目前现有智能拾取技术的初至标签制作基本上依赖人工进行筛选,但在海量数据中人工筛选具有代表性的样本费时费力,且具有一定程度的偏向性和冗余性,人工筛选标签样本的质量和时效性制约了深度神经网络拾取方法的精度和效率。

技术实现思路

[0004]本专利技术提供了一种地震初至训练集生成方法及装置,可以降低初至训练样本筛选的偏向性和随机性,得到更优的地震初至训练集,进而便于提高深度神经网络初至拾取方法的精度和效率。
[0005]第一方面,本专利技术实施例提供了一种地震初至训练集生成方法,该方法包括:获取样本池信息和基准模型信息;利用所述样本池信息和所述基准模型信息生成预测信息;计算所述预测信息的信息熵数据和分类数据;根据所述信息熵数据和所述分类数据确定地震初至训练集。
[0006]第二方面,本专利技术实施例还提供一种地震初至训练集生成装置,该装置,包括:获取模块,用于获取样本池信息和基准模型信息;生成模块,用于利用所述样本池信息和所述基准模型信息生成预测信息;计算模块,用于计算所述预测信息的信息熵数据和分类数据;确定模块,用于根据所述信息熵数据和所述分类数据确定地震初至训练集。
[0007]第三方面,本专利技术实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述地震初至训练集生成方法。
[0008]第四方面,本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述地震初至训练集生成方法的计算机程序。
[0009]本专利技术实施例带来了以下有益效果:本专利技术实施例提供了一种地震初至训练集生
成方法及装置,该方法包括:获取样本池信息和基准模型信息;利用样本池信息和基准模型信息生成预测信息;计算预测信息的信息熵数据和分类数据;根据信息熵数据和分类数据确定地震初至训练集。本专利技术实施例可以利用信息熵数据和分类数据,在样本池信息中自动筛选更具有代表性和最具有价值的样本数据,进而得到更优质的地震初至训练集,以便提高智能拾取的工作效率和精度。
[0010]本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
[0011]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0012]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本专利技术实施例提供的地震初至训练集生成方法流程图;
[0014]图2为本专利技术实施例提供的U

GAN用于初至波分割流程示意图;
[0015]图3为本专利技术实施例提供的深度主动学习流程框架示意图;
[0016]图4为本专利技术实施例提供的常规学习的验证集Loss曲线(左)和主动学习的验证集Loss曲线(右);
[0017]图5为本专利技术实施例提供的常规学习和主动学习的F1得分示意图;
[0018]图6为本专利技术实施例提供的一种地震初至训练集生成装置结构框图;
[0019]图7为本专利技术实施例提供的计算机设备结构框图;
[0020]图8为本专利技术实施例提供的另一种地震初至训练集生成装置结构框图;
[0021]图9为本专利技术实施例提供的另一种地震初至训练集生成装置结构框图;
[0022]图10为本专利技术实施例提供的确定模块结构框图。
具体实施方式
[0023]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0024]为了进一步提升智能化初至拾取技术的精度和效率,本专利技术实施例提供的一种地震初至训练集生成方法及装置,该方法利用深度主动学习技术自动筛选最具有代表性和最具有价值的地震数据进行初至标注,极大地丰富了标签样本的多样性和减少了标签的数量,无需人工干预,从而在一定程度上避免了人工挑选样本的偏向性和随机性,以最低成本达到最优的拾取精度和效率。
[0025]为便于对本实施例进行理解,首先对本专利技术实施例所公开的一种地震初至训练集
生成方法进行详细介绍。
[0026]本专利技术实施例提供了一种地震初至训练集生成方法,参见图1所示的一种地震初至训练集生成方法流程图,该方法包括以下步骤:
[0027]步骤S102,获取样本池信息和基准模型信息。
[0028]在本专利技术实施例中,样本池信息包括多组初至数据,每组初至数据可用于训练基准模型,以使基准模型能够识别初至信息。
[0029]基准模型可以是主动学习模型,可以根据实际需求进行选取,本专利技术实施例对此不作具体限定。
[0030]步骤S104,利用样本池信息和基准模型信息生成预测信息。
[0031]在本专利技术实施例中,利用基准模型对样本池中的样本进行预测,得到预测信息。
[0032]步骤S106,计算预测信息的信息熵数据和分类数据。
[0033]在本专利技术实施例中,信息熵数据用于描述预测信息的不确定性程度,分类数据用于描述预测信息的差异性分布情况。在得到预测信息后,分别计算其信息熵数据和分类数据,从而得到预测信息的评价情况。
[0034]步骤S108,根据信息熵数据和分类数据确定地震初至训练集。
[0035]在本专利技术实施例中,根据信息熵数据和分类数据对预测信息对应的样本信息进行筛选,从而实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地震初至训练集生成方法,其特征在于,包括:获取样本池信息和基准模型信息;利用所述样本池信息和所述基准模型信息生成预测信息;计算所述预测信息的信息熵数据和分类数据;根据所述信息熵数据和所述分类数据确定地震初至训练集。2.根据权利要求1所述的方法,其特征在于,获取样本池信息和基准模型信息之前,还包括:获取初始模型信息和标注样本数据;利用所述标注样本数据训练所述初始模型信息,得到基准模型信息。3.根据权利要求1所述的方法,其特征在于,获取样本池信息和基准模型信息之前,还包括:获取预训练模型信息,将所述预训练模型信息作为基准模型信息。4.根据权利要求1所述的方法,其特征在于,计算所述预测信息的信息熵数据,包括:根据所述预测信息生成概率图数据;根据所述概率图数据计算信息熵数据。5.根据权利要求4所述的方法,其特征在于,包括利用如下公式根据所述概率图数据计算信息熵数据:H(p)=

∑p
i
Log2(p
i
)其中,H(p)表示信息熵数据,p
i
表示概率图数据中给定信息属于类别i的概率。6.根据权利要求1所述的方法,其特征在于,计算所述预测信息的分类数据,包括:计算所述预测信息和样本集信息的图像语义特征差异值,得到分类数据。7.根据权利要求1所述的方法,其特征在于,根据所述信息熵数据和所述分类数据确定地震初至训练集,包括:根据所述信息熵数据和所述分类数据对所述预测信息对应的样本池信息进行排序,得到排序结果;根据排序结果确定地震初至训练集。8.根据权利要求1所述的方法,其特征在于,根据所述信息熵数据和所述分类数据对所述预测信息对应的样本池信息进行排序,得到排序结果,包括:根据所述信息熵数据对所述预测信息对应的样本池信息进行排序,得到第一排序结果;根据所述第一排序结果确定目标样本池信息;根据所述分类数据和所述预测信息,对所述目标样本池信息进行排序,得到排序结果。9.根据权利要求1

8任一项所述的方法,其特征在于,还包括:根据所述地震初至训练集数据训练深度神经网络;利用训练后的深度神经网络生成初至拾取结果。10.一种地震初至训练集生成装置,其特征在于,包括:获取模块,用于获取样本池信息和基准模型信息;生成模块,用于利用所述样本池信息和所述基准模型信息生成预测信息...

【专利技术属性】
技术研发人员:胡莲莲郑晓东曾庆才胡英首皓王春明晏信飞
申请(专利权)人:中国石油天然气股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1