一种海量地震数据并行抽道集方法技术

技术编号:11763870 阅读:96 留言:0更新日期:2015-07-23 14:00
本发明专利技术涉及一种海量地震数据并行抽道集方法,其包括多级数据并行排序步骤,第一级数据并行排序步骤包括对原始地震数据的并行局部排序,以及对并行局部排序结果的全局排序,全局排序结果作为本级处理结果输出,以备第二级数据并行排序步骤使用;第二级以及其它级数据并行排序步骤包括对前一级数据并行排序步骤的处理结果的并行局部排序,并行局部排序结果作为本级处理结果输出,以备后一级数据并行排序步骤使用;并行局部排序包括将原始地震数据或者前一级数据并行排序步骤的处理结果分成多个数据包分发给多个并行节点,各并行节点分别按照排序关键字对数据包中的数据进行排序;全局排序包括按照排序关键字调整各并行节点的数据排序结果之间的顺序。本发明专利技术有效缩短抽道集时间。

【技术实现步骤摘要】

本专利技术涉及地球物理勘探
,尤其涉及。
技术介绍
现今随着油气田勘探开发程度的日益加深,勘探目标越来越隐蔽,采集精度也越来越高,需要采用高分辨率地震勘探和四维地震勘探等高新技术进行野外勘探,由此野外采集的地震数据量也随之成倍增长,因此地震资料处理系统必须具备海量(TB级)数据管理能力,不仅可以存取大量的数据文件,而且还可以高速地访问处理数据。不同的数据处理算法需要输入不同域的地震数据,例如共炮点(CSP)、共中心点(CMP)或者共深度点(⑶P)道集等地震数据。因此地震资料处理系统不仅要有海量(TB级)数据管理能力,而且还要有高效的道集排序能力,在不同道集之间快速转换,或者将杂乱无序的道集数据快速地整理成一个有序道集,从而为复杂的偏移成像算法快速地提供不同域的道集数据,节约宝贵的计算机时。现有技术中,对于抽道集等地震数据预处理算法,按照排序过程中地震数据存储的形式,可以分为两种道集排序方式:一是内部排序,即将地震数据全部读入到计算内存中进行常规排序,完成后将结果输出到硬盘文件;二是外部排序,即将一部分地震数据读入到内存中进行常规排序,然后将中间结果输出到临时文件中,最后根据临时文件再次排序、合并。这种外部排序的缺点是当地震数据量很大时(TB级),临时文件会非常大,随机读取海量的临时文件会带来二次排序问题。2001年西方地球物理公司的Yi Luo等人提出,根据B-Tree排序理论将内存中的地震数据进行内部排序,然后输出到多个个较小的临时文件中,以减少随机读取临时文件的次数。虽然该方法在一定程度上解决了临时文件的二次排序问题,但是单线程的运行方式限制了运行效率的进一步提升。目前,国内外的研究学者对海量地震数据处理的研究方向主要集中在并行处理算法上。并行处理也称为模块内部并行,是对某些计算量巨大的模块(如叠前偏移模块)直接以并行算法实现,从而最大程度地利用并行节点的物理计算能力。并行算法通常比较复杂,难点是如何巧妙地分割算法任务和输入数据,同时精确控制进程、线程间的同步以获得最佳的并行加速比。本专利技术的专利技术人正是基于长期的实务经验和相关的专业知识,探索出一种能够利用计算机集群硬件实现多节点数据高效并行处理的地震数据处理方法。
技术实现思路
基于上述原因,本专利技术的目的是提供一种利用计算机集群硬件实现多节点数据高效并行处理的海量地震数据并行抽道集方法。该方法包括两级或两级以上数据并行排序步骤,其中:第一级数据并行排序步骤包括对原始地震数据进行并行局部排序,以及对并行局部排序结果进行全局排序,全局排序结果作为本级处理结果输出,以备第二级数据并行排序步骤使用;第二级以及其它级数据并行排序步骤包括对前一级数据并行排序步骤的处理结果进行并行局部排序,并行局部排序结果作为本级处理结果输出,以备后一级数据并行排序步骤使用;所述并行局部排序包括将原始地震数据或者前一级数据并行排序步骤的处理结果分成多个数据包分发给多个并行节点,各并行节点分别按照排序关键字对数据包中的数据进行排序;所述全局排序包括按照排序关键字调整各并行节点的数据排序结果之间的顺序。根据本专利技术的实施例,在上述并行局部排序中,每一并行节点在完成数据排序时接触阻塞,将自己的同步标志位置真,然后检查其它并行节点的同步标志位的状态:若其它并行节点的同步标志位均为真,则结束阻塞,否则继续阻塞,以等待其它并行节点完成数据排序。根据本专利技术的实施例,在上述每一级数据并行排序步骤中,可以由最后一个完成数据排序的并行节点收集所有并行节点的数据排序结果。进一步地,在第一级数据并行排序步骤中,由最后一个完成数据排序的并行节点执行全局排序。进一步地,在第二级以及其它级数据并行排序步骤中,由前一级数据并行排序步骤中最后一个完成数据排序的并行节点将前一级数据并行排序步骤的处理结果按照前一级排序关键字分成多个数据包分发给多个并行节点。此外,在第一级数据并行排序步骤中,可以由第一个开始任务进程的并行节点执行并行局部排序的初始化操作,待初始化操作完成后各并行节点才开始数据排序;在最后一级数据并行排序步骤中,可以由最后一个完成数据排序的并行节点执行并行局部排序的收尾操作。根据本专利技术的实施例,可以采用哈希表快速排序法进行并行局部排序和全局排序。具体地,根据本专利技术的实施例,上述海量地震数据并行抽道集方法可以包括三级数据并行排序步骤:在第一级数据并行排序步骤中,并行局部排序包括将原始地震数据按照道序号分成多个数据包分发给多个并行节点,各并行节点分别以线号为排序关键字对数据包中的数据进行排序,全局排序以线号为排序关键字调整各并行节点的数据排序结果之间的顺序;在第二级数据并行排序步骤中,并行局部排序包括将第一级数据并行排序步骤的全局排序结果按照线号分成多个数据包分发给多个并行节点,各并行节点分别以道集序号为排序关键字对数据包中的数据进行排序;在第三级数据并行排序步骤中,并行局部排序包括将第二级数据并行排序步骤的并行局部排序结果按照道集序号分成多个数据包分发给多个并行节点,各并行节点分别以偏移距为排序关键字对数据包中的数据进行排序。与现有技术相比,本专利技术提供的海量地震数据并行抽道集方法具有以下优点:1、本专利技术根据地震数据的存储形式,将地震数据抽道集过程分为两级或两极以上数据并行排序步骤,在每一级并行排序步骤中,将待处理的数据体分割成多个数据包分发给多个并行节点,每个并行节点启动独立的排序作业,即对接收的数据包中的数据进行排序,当所有并行节点完成排序作业后,合并所有并行节点的排序结果。这种方法简单易行,能够充分利用现今计算机集群硬件多节点、多进程的并行处理能力,极大地缩短了地震数据抽道集的运行时间,提高了地震处理系统对海量数据管理能力和运行效率。2、本专利技术在地震数据抽道集过程中,将地震数据按照道序号进行索引排序,仅将道头信息读入内存,与现有技术中需将地震道数据和道头信息同时读入内存的方法相比,大大减少了内存的占用量和访问量,进一步提升了地震处理系统的运行效率。3、本专利技术在每一级数据并行排序步骤中,通过判断各并行节点任务进程的先后次序以及利用时间阻塞来实现并行节点之间的同步运行,解决了进程、线程间同步精确控制的难题,获得了出色的并行加速比。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其它优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。【附图说明】附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术当前第1页1 2 3 本文档来自技高网
...
一种海量地震数据并行抽道集方法

【技术保护点】
一种海量地震数据并行抽道集方法,包括两级或两级以上数据并行排序步骤,其中:第一级数据并行排序步骤包括对原始地震数据进行并行局部排序,以及对并行局部排序结果进行全局排序,全局排序结果作为本级处理结果输出,以备第二级数据并行排序步骤使用;第二级以及其它级数据并行排序步骤包括对前一级数据并行排序步骤的处理结果进行并行局部排序,并行局部排序结果作为本级处理结果输出,以备后一级数据并行排序步骤使用;所述并行局部排序包括将原始地震数据或者前一级数据并行排序步骤的处理结果分成多个数据包分发给多个并行节点,各并行节点分别按照排序关键字对数据包中的数据进行排序;所述全局排序包括按照排序关键字调整各并行节点的数据排序结果之间的顺序。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄忠玉刘兰锋魏修成季玉新
申请(专利权)人:中国石油化工股份有限公司中国石油化工股份有限公司石油勘探开发研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1