一种地震数据的地震道集并行抽取方法技术

技术编号:11404771 阅读:104 留言:0更新日期:2015-05-03 20:53
本发明专利技术涉及一种地震数据的地震道集并行抽取方法,包括以下步骤:将地震数据文件使用均匀化存储技术写入磁盘中;客户端发出读地震道集请求指令后,地震道集指令发送到各个数据节点上;数据节点对地震道集指令进行解析,转换为读地震道请求队列,再根据队列读取本地磁盘中的地震道数据,最后地震道数据返回给客户端;客户端接收地震道数据,并对地震道数据按道集进行排序,最后返回给地震数据处理软件。本发明专利技术解决了常规基于磁盘阵列系统由于串行抽取地震道集从而导致的效率低下的问题,大大提高了地震数据的I/O效率,且可扩展性强;让各个数据节点执行完非连续式地震道集指令的时间趋于一致,保证了存储系统能够达到理论上预期的抽取效率。

【技术实现步骤摘要】
一种地震数据的地震道集并行抽取方法
本专利技术涉及一种地球勘探中海量地震数据存储技术和设备,尤其涉及一种地震数据的地震道集并行抽取方法。
技术介绍
随着地震勘探技术的不断进步和多道多分量地震勘探采集技术的应用,使得地震勘探的数据量巨大,这给地震数据的存储和处理带来了一定的困难。在地震数据存储过程中,地震数据一般以地震道为单位记录组成一种特殊的文件格式(如SEG-Y、SEG-D文件格式等),其存储的地震数据信息结构如图1所示,它是由文件卷头信息和地震道信息组成,其中地震道信息包括地震道头信息和地震道数据两部分。根据卷头和道头信息可从地震数据文件中获取多种地震道集,地震道集是地震数据中具有某一共同属性的地震道的集合,它是地震数据处理中的基本模块,比如常用的地震道集有共炮点道集(CSG)、共接收点道集(CRG)、共中心点道集(CMP)和共偏移距道集(COG)。通常地震数据文件根据某一种地震道集按顺序方式记录,故该地震道集中的地震道在地震数据文件中是连续的(简称为连续式地震道集),此时其它几种地震道集中的地震道就无法保持连续,在地震数据文件中呈离散分布(简称为非连续式地震道集)。根据地震道的不同属性,从图1中的M个地震道获取不同的地震道集组合,称为道集抽取。当地震数据存储介质为磁盘时,在抽取非连续式地震道集过程中,由于待抽取的地震道位置不连续,故磁盘读取完一个地震道数据后,磁头需要机械移动到下一个地震道数据的位置,才能重新开始读数据操作,即磁盘的访问过程属于随机访问。访问数据时,磁盘的响应时间由磁头的寻道时间、旋转延时时间和传送时间三部分组成。目前市场上主流磁盘的寻道时间典型值是4.6ms,旋转延时则取决于磁盘的转速:普通7200RPM硬盘的转动延迟是4.2ms,而高端10000RPM的是3ms。传送时间包括内部数据传送时间和外部数据传送时间,其中内部数据传送时间是指当磁盘存储器的寻址工作完成之后,磁头至硬盘缓存之间的数据时间;外部数据传送时间为电脑通过数据总线从磁盘内部缓存区中所读取数据的时间。目前主流磁盘的内部数据传送速率在70~90MB/s,而外部数据传输速率在100MB/s以上。对于地震道而言,一般单个地震道数据量都不大,约为30KB,其传送时间为0.3~0.4ms。因此,磁盘在小数据读写过程中,寻道时间和旋转延时远大于传送时间。可见大量的随机小数据访问,致使机械磁盘的性能大大下降,成为抽取非连续式地震道集的I/O瓶颈。在实际地震数据处理方面,地震数据处理动辄需要处理数以TB的海量数据,在对地震数据进行数理方法如静校正、叠加、DMO、滤波等处理时,处理过程中需要反复抽取不同的地震道集数据。故地震数据处理具有处理的数据量大、处理过程多和反复处理等特征,这些特征带来了巨大的磁盘I/O访问量问题,因此,存储设备的I/O性能成为海量地震数据处理时间的一个关键因素。综上分析,从地震数据存储和处理的特征反映了地震勘探数据处理系统中将面临的一个关键问题:磁盘I/O所花费的时间占总处理的时间比例越来越大。在地震勘探数据处理系统中,提供一种专门快速地实现地震数据的存储系统显得尤为重要。磁盘阵列技术由于其自身所具有的诸多优点正在得到越来越广泛的应用,它是由多块磁盘构成的一种超大容量存储系统,已成为地震数据存储中常用的存储设备。但目前基于磁盘阵列设计的地震数据存储系统无法克服随机小数据访问I/O效率低的问题。常规的基于磁盘阵列抽取地震道集的流程如图2所示,地震数据处理软件将地震道集请求根据索引转换成一系列的读地震道的读请求,即标准的seek和read函数调用。当操作系统接收到这些函数调用后,会将其发送给磁盘阵列控制器,控制器再根据具体情况指挥相应的磁盘进行地震道数据的读取操作。地震数据处理软件在接收到地震道数据后,将发送执行下一个地震道数据读取过程。最后循环直至所有的地震道都正确执行完后,地震数据处理软件可获得地震道集数据。从常规的地震道集抽取流程可以看出,因为read函数一般为阻塞调用,所以只有在当前地震道数据访问结束后,才能发起下一地震道指令数据读取,即是以串行方式来读取地震道集中的各个地震道数据。根据上述流程,分析抽取连续式地震道集的性能:在磁盘上读取一块数据所需要的时间Ttotal可描述为Ttotal=tseek+tdelay+ts(1)式中,tseek为寻道时间,tdclay为旋转延时,ts为传送时间。在抽取顺序地震道集时,由于目标数据是连续的,所以文件系统的预读技术及多I/O合并技术会使得tseek=0且tdelay=0,则式(1)可简化为式中,br为每次读写的数据量,D为数据传送速率。假设有N块磁盘构成的无冗余阵列结构,一个地震道(设数据量约为B)分布存储在不同的磁盘上,每块磁盘上地震道数据量为b(i)(i=1,2,…,N),则b(1)+b(2)+...+b(N)=B,在顺序读取一个地震道数据过程中,有N块磁盘并行进行I/O操作,那么磁盘阵列读取一个地震道数据时间Tone_seq取决于各磁盘响应时间Ttotal的最大值,即为假设在理想情况下,地震道数据量均匀分布存储在各块磁盘上,则b(i)=B/N,那么读取一个顺序式地震道时间最短且为Ts_min=B/ND。当连续式地震道集中含有G个地震道时,其磁盘阵列抽取顺序地震道集的最短时间TG_seq为式(4)可以看出,磁盘阵列能够快速并行地抽取连续式地震道集,这是磁盘阵列成为地震数据存储中常用的存储设备的一个重要原因。同理,根据上述常规磁盘阵列系统分析抽取非连续式地震道集的性能:如前所述,磁盘在抽取非连续式地震道集的过程属于随机小数据访问,故tseek和tdelay远大于ts。磁盘阵列读取一个地震道的时间取决于各磁盘响应时间Ttotal的最大值,根据式(1)可知,读取一个分布式地震道时间Tone_rand为当磁盘阵列中各磁盘型号相同情况下,可视各块磁盘平均寻道时间tscek_average和平均旋转延时tdelay_avcrage近似相等,则式(5)可简化为Tone_rand=tseek_averge+tdelay_averge(6)由上分析可知,常规的基于磁盘阵列系统的地震道集抽取过程是以串行方式来读取地震道,因此,当非连续式地震道集中含有G个地震道单位时,则抽取时间TG_rand为TG_rand=GTone_rand=G(tseek_averge+tdelay_averge)(7)式(7)表明,抽取非连续式地震道集的时间主要受磁盘的机械性能限制,与磁盘数量无关。由此可见,通过扩展磁盘阵列磁盘数目的方式无法提高非连续式地震道集的I/O访问效率。综上,从式(4)和式(7)可知,常规的磁盘阵列系统虽然可以提高连续式地震道集的I/O访问效率,但无法提高非连续式地震道集的抽取速度。固态硬盘(SolidStateDisk,SSD)是近些年发展的新技术,它克服了机械硬盘的机械性能限制,具有良好的随机访问效率。但固态硬盘存储量小(商用固态硬盘容量大多小于512GBytes)且价格昂贵,不适用于的海量地震数据存储。其次,由于固态硬盘采用Flash颗粒存储技术,该技术在写入某单元之前要对该单元进行擦除操作,而Flash是有擦除次数限制的,多次擦除之后,会导致存储单元失效本文档来自技高网...
一种地震数据的地震道集并行抽取方法

【技术保护点】
一种地震数据的地震道集并行抽取方法,其特征在于包括以下步骤:步骤一,将地震数据文件按地震道数据使用均匀化存储技术写入磁盘中;步骤二,客户端中的地震数据处理软件发出读地震道集请求指令后,地震道集指令以广播方式发送到各个数据节点上;步骤三,数据节点对接收到的地震道集指令进行解析,转换为相应的读地震道请求队列,再根据队列读取本地磁盘中的地震道数据,最后将读出的地震道数据返回给客户端;步骤四,客户端接收数据节点阵列返回的地震道数据,并对地震道数据按道集的地震道顺序进行排序,最后返回给地震数据处理软件。

【技术特征摘要】
1.一种地震数据的地震道集并行抽取方法,其特征在于包括以下步骤:步骤一,将地震数据文件按地震道数据使用均匀化存储技术写入磁盘中;将地震数据文件按地震道数据均匀化存储技术写入磁盘中的具体方法是:客户端获取各数据节点信息,包括数据节点总数量N和每个数据节点IP地址;对数据节点进行初始化,即在每个数据节点中建立相应的文件名或编号与之对应,为每一个数据道用伪随机编码方式确定存储位置,便于在读取数据时进行查找;客户端向数据节点阵列发送命令表示将要写入文件,数据节点收到命令后,开始准备接受数据包;以地震道为单位读取地震数据文件,按照地震道数据均匀化存储技术将地震道数据分别以网络包的方式发送给数据节点,数据节点接收网络包后将其写入相应的文件中;当地震数据文件发送完成后,向数据节点发送写文件结束命令,写文件过程结束;步骤二,客户端中的地震数据处理软件发出读地震道集请求指令后,地震道集指令以广播方式发送到各个数据节点上;步骤三,数据节点对接收到的地震道集指令进行解析,转换为相应的读地震道请求队列,再根据队列读取本地磁盘中的地震道数据,最后将读出的地震道数据返回给客户端;步骤四,客户端接收数据节点阵列返回...

【专利技术属性】
技术研发人员:武杰张捷
申请(专利权)人:安徽吉拓电子技术有限公司
类型:发明
国别省市:安徽;34

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1