The invention provides a method and device for large scale seismic data storage and rapid positioning. The storage method includes the design of the first level hash index structure, the data object storage space is divided into a plurality of data partition; design of second level hash index structure, the data is divided into a plurality of data blocks; data objects stored in the data partition and data block. The fast positioning method according to the data object including the first hash value, to determine the data object belongs to the data partition; according to the hash range should handle data partitions for each object storage server, determine the data partition is the object storage server through the data object; second hash values, data block is determined by the position of the object data object. Information. According to the method and device of the invention, it can support elastic expansion of large scale seismic data object storage space, realize load balancing at low cost, and support efficient management of large-scale seismic data.
【技术实现步骤摘要】
适用于大规模地震数据存储、快速定位的方法及装置
本专利技术涉及石油地震勘探资料数据存储领域,更具体地讲,涉及一种适用于大规模地震数据存储、快速定位的方法及装置。
技术介绍
当前的石油天然气地震勘探工作中,由于可控震源高效采集技术的推广应用和高密度三维地震勘探的迅速发展,地震观测采样精度越来越高,采集的数据越来越大。采集获得的数据量呈几何指数增长,从几十TB到上百TB,甚至更大。同时,多业务的并发应用规模对于地震数据存储的访问频率越来越高。如此庞大的数据量和应用规模对地震数据的存储技术提出了新的要求。地震数据存储的文件系统必须具备对PB甚至EB级存储空间进行管理的能力。由于现有的大多数计算机集群文件系统均采用对象存储的方法来管理数据,每个文件被分成固定大小的对象存储在系统中,随着存储总量和处理性能的提高,系统中对象的数量和其访问频率均会有大幅度的增加,数据放置和定位的开销随存储对象数量的增多而增加。当地震数据的存储规模达到PB级时,文件系统需要对超过上亿规模的对象提供放置和定位服务。特别是当数据多以小文件的方式存储时,需管理的对象位置信息可达到万亿规模。但是受计算机集群文件系统技术现状和数据位置信息管理维护方法局限性的影响,在面向大规模地震数据存储读写应用时,多个存储服务器会随着数据规模的扩大和应用的增多而造成负载的不均衡,计算机集群文件系统会根据服务器的磁盘空间利用率和访问负载来调整数据分布。在进行负载均衡时,对于通过记录位置来管理存储空间的系统而言,大量地震数据对象文件的迁移会导致数据位置信息的频繁更改,对象位置信息一致性的系统开销工作量增大。由于需维护 ...
【技术保护点】
一种适用于大规模地震数据的存储方法,其特征在于,所述存储方法包括以下步骤:设计第一级哈希索引结构,将数据对象存储空间划分为多个数据分区,并将所述数据分区分布到不同数据存储服务器以支持并发操作;设计第二级哈希索引结构,将所述数据分区划分为多个数据块组,以支持文件系统调整数据分区大小;将数据对象存储在所属数据分区和数据块组。
【技术特征摘要】
1.一种适用于大规模地震数据的存储方法,其特征在于,所述存储方法包括以下步骤:设计第一级哈希索引结构,将数据对象存储空间划分为多个数据分区,并将所述数据分区分布到不同数据存储服务器以支持并发操作;设计第二级哈希索引结构,将所述数据分区划分为多个数据块组,以支持文件系统调整数据分区大小;将数据对象存储在所属数据分区和数据块组。2.根据权利要求1所述的适用于大规模地震数据的存储方法,其特征在于,所述将数据对象存储在所属的数据分区和数据块组的步骤包括:根据第一级哈希索引计算数据对象第一哈希值,确定数据对象所属数据分区;根据第二级哈希索引计算数据对象第二哈希值,确定数据对象所属数据块组。3.根据权利要求2所述的适用于大规模地震数据的存储方法,其特征在于,所述计算第一哈希值与第二哈希值的方法包括一致性哈希算法,所述第一级哈希索引与第二级哈希索引为可扩展哈希索引。4.根据权利要求1所述的适用于大规模地震数据的存储方法,其特征在于,所述存储方法还包括根据每个数据存储服务器所应处理数据分区的哈希值范围将所述数据分区分布到不同数据存储服务器,所述分布步骤采用一致性哈希方法。5.根据权利要求4所述的适用于大规模地震数据的存储方法,其特征在于,所述每个数据存储服务器所应处理数据分区的哈希值范围根据查询全局映射表所得,所述全局映射表是将一致性哈希以全局映射表的方式缓存所有节点,记录每个存储服务器所应处理数据分区的哈希范围。6.一种适用于大规模地震数据的快速定位方法,其特征在于,所述快速...
【专利技术属性】
技术研发人员:李振,李亚林,何光明,刘鸿,金德刚,罗红明,席彬,安胜平,巫骏,
申请(专利权)人:中国石油集团川庆钻探工程有限公司地球物理勘探公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。