System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 油气勘探地震属性自动选取方法技术_技高网
当前位置: 首页 > 专利查询>李国和专利>正文

油气勘探地震属性自动选取方法技术

技术编号:40634645 阅读:3 留言:0更新日期:2024-03-13 21:18
本发明专利技术提出了一种油气勘探地震属性自动选取方法及系统,简称RSFRSD(Feature selection based on rough set and fuzzy relationship for SeismicData)。RSFRSD解决了邻域粗糙集无法自适应确定邻域大小以及对样本模糊性描述不足的问题,综合邻域粗糙集和模糊关系实现对地震属性的自动选取。首先根据样本分布计算隶属度阈值,然后利用邻域样本隶属度与阈值重新定义邻域粗糙上、下近似;其次根据特征差异自适应确定样本邻域大小,对样本空间进行分割,优化特征评价;最后通过评价决策属性对地震属性子集依赖度进行地震属性选取。RSFRSD应用效果良好,有效实现了降低数据的维度并提升识别准确度。

【技术实现步骤摘要】

本专利技术属于地球物理勘探的数据优化,具体涉及一种综合邻域粗糙集和模糊关系的地震属性自动选取方法。


技术介绍

1、地震数据蕴含着复杂地层结构信息,通过利用地震数据可认识地质构造。地震相识别是地震数据重要应用领域。地震相分析能获得对应的沉积相,可以预测地层岩性和分析沉积环境,地震相识别提高油气勘探开发能力。地震数据综合各种地震属性,各种地震属性对地震相识别能力不同,地震数据或其不同属性选取组合对地震相识别效果不佳,识别模型训练效率低,因此,地震属性自动、有效、高效选取是提高地震数据有效利用和提高模型训练效果效率的关键。本质上,地震属性自动选取是在地震数据中地震属性提取基础上自动选取识别能力强的地震属性子集,从而减少建模数据输入,提高训练效率和识别精度。目前已有一些地震属性选取方法,如:

2、中国专利“cn103048688一种基于三步法的地震属性优选方法”提供了一种地震属性优选方法。此专利能够选取有效性大的地震属性并做压缩处理,首先从测井特征、地震属性找到对应的最大值和最小值,获得测井特征值和地震属性的区域范围;然后对每个区域分成一定的等分;再将地震属性进行一定的压缩处理。该专利所述的技术方案在实现属性压缩时,必须进行人工检验,实现属性的最终选取,无法实现自动选取属性,存在缺陷。此外,该专利在属性区域范围内仅保留了一个最具代表性的属性,忽略了多个属性组合也能达到优秀的效果,只保留一个属性无法保证后续的模型能得到最优的结果。

3、中国专利“cn109633748b一种基于改进遗传算法的地震属性优选方法”将长度为地震属性个数的二进制格式对种群个体编码,以深度信念网络的分类准确率作为适应度函数,计算种群中个体的适应度值,保留适应度值大的一半个体,反复运行,直到选择出最优地震属性组合,这种方法虽能避免局部最优,但过于依赖概率的设定,而且耗费大量时间用于种群的进化以及适应度值的计算,导致效率不高。

4、地震属性自动选取属于数据优化领域特征选取。特征选择分为封装式(如recursive feature elimination cross validation, rfecv算法)、嵌入式(如l1正则算法)和过滤式(如relief算法)。前两者与机器学习模型密切相关[3,4],而后者独立于机器学习,并成为主要特征选择方法[5~7],其实现从抽样计算特征区分能力,到全局特征区分矩阵遍历最优子集求解,尤其基于传统粗糙集方法[8],但存在两个问题:等价关系只适用于离型散数据,并没用到重复样本的统计信息。而扩展的粗糙集理论,如邻域粗糙集模型、模糊粗糙集等[9~11],利用样本的相似性划分空间,进一步实现连续型特征的选择。

5、wang等人[12]利用模糊邻域定义了样本的模糊决策,引入参数化模糊关系来描述实值数据分析中的模糊信息,提出新的粗糙集模型,该模型定义了模糊决策和条件属性之间的依赖关系来评估候选特征的重要性,从而选出特征子集。徐波等人[13]提出了加权依赖度,分析邻域半径的自适应取值并提出一种新的启发式约简算法,将其用于特征选取中,该方法将特征标准差的统计量作为邻域半径,但仅用特征差值的和来计算邻域,不适用于高维数据。针对邻域大小仅依靠经验来指定的问题,彭潇然等人[14]提出了一种自适应取值方法,通过指定取值区间,在区间上用适应值函数自动地选出最合适的取值。该方法虽然改变了点值式的取值方法,但仍然需要人为指定取值区间,且对邻域大小进行评价的适应值函数引进了新的权值变量,权值变量的取值也无法实现自适应。

6、为了更好地利用样本分布信息,考虑样本间的模糊关系,自适应确定邻域大小,提出采用连续型条件特征差异的模糊粗糙关系的地震属性自动选取方法rsfrsd(featureselection based on rough set and fuzzy relationship for seismic data),可自适应邻域半径取值,无需手动设置阈值,提高地震属性选取效率,有效解决了上述专利和方法中存在的一些问题。

7、[1] 陈红兵. 一种基于三步法的地震属性优选方法[p]. 四川:cn103048688a,2013-04-17.

8、[2] 李克文,周广悦,刘文英,焦宗浩. 一种基于改进遗传算法的地震属性优选方法[p]. 山东省:cn109633748b,2020-05-01.

9、[3] wang canhua, xiao zhiyong, wu jianhua. functional connectivity-based classification of autism and control using svm-rfecv on rs-fmri data[j]. physica medica, 2019, 65: 99-105.

10、[4] tibshirani, ryan j. the lasso problem and uniqueness[j].electronic journal of statistics, 2013, 7(1): 1456-1490.

11、[5] kononenko i. estimating attributes: analysis and extensions ofrelief [c]// european conference on machine learning on machine learning.berlin: springer-verlag, 1994.

12、[6] 刘艳, 程璐, 孙林. 基于 k-s 检验和邻域粗糙集的特征选择方法[j].河南师范大学学报(自然科学版), 2019, 47(2): 21-28. (liu yan, cheng lu,sun lin.feature selection method based on k-s test and neighborhood rough sets[j].journal of henan normal university (natural science edition), 2019, 47(2):21-28.)

13、[7] 刘琨, 封硕. 加强局部搜索能力的人工蜂群算法[j]. 河南师范大学学报(自然科学版), 2021, 49(2): 15-24. (liu kun, feng shuo. an improved artificialbee colony algorithm for enhancing local search ability[j]. journal of henannormal university (natural science edition), 2021, 49(2): 15-24.)

14、[8] zou li, li hongxin, jiang wei, et al. an improved fish swarmalgorithm for neighborhood rough se本文档来自技高网...

【技术保护点】

1.一种油气勘探地震属性自动选择方法,其特征在于:(a)结合粗糙集和模糊关系,计算地震属性相似度、等价类隶属度阈值,并初始化地震属性子集;(b)根据地震属性重要度依次评价属性有效性,并选择有效地震属性,形成最优地震属性子集。

2.如权利要求1所述的一种油气勘探地震属性自动选取方法(RSFRSD),其特征在于,所述步骤具体如以下算法:

3.RSFRSD将结果地震属性子集subfeat初始化为空集,待选地震属性子集B初始化为原始地震属性子集C。在进行运算前,采用最大最小归一化方法对地震数据集进行归一化,避免各个地震属性数据差异过大对相似度计算产生影响。RSFRSD要求样本对各个决策类的隶属度集作为输入。对于样本,依据得出与其他所有样本的模糊相似度,随后进行样本对其所属类隶属度的计算。为了充分利用样本信息,按照《说明书》定义5中式(3)计算样本的隶属度,设等价类包含的最少样本数为,将样本同类的最近个样本相似度之和与所有样本的相似度之和的比值作为样本对其所属类的隶属度。将每个等价类内样本的最小隶属度值作为该等价类的隶属度阈值。

4.根据《说明书》定义7中式(10)计算地震属性重要度,即决策属性对地震属性子集依赖度的变化。如《说明书》定义7中式(9)所示,正域样本个数与全体样本个数之比即为决策属性对地震属性子集的依赖度。不同于经典的邻域粗糙集,RSFRSD结合了模糊关系,利用邻域内样本隶属度满足阈值要求的样本比例来判断样本是否为正域样本。在计算地震属性重要度的过程中,地震属性子集B不断变化,RSFRSD以当前地震属性子集中最大的地震属性标准差与参数的比值作为邻域半径,解决了自适应确定邻域大小问题,通过实验验证了其有效性。

5.若给定的决策信息系统有n个样本,|D|个类别,原地震属性集中包含|C|个属性,地震属性子集中包含m个属性,那么计算样本对于等价类的隶属度的时间复杂度为O(n*|D|),计算加入候选属性后样本间领域关系的时间复杂度为O(n2),算法的总时间复杂度为O(n2 m|C|)。

...

【技术特征摘要】

1.一种油气勘探地震属性自动选择方法,其特征在于:(a)结合粗糙集和模糊关系,计算地震属性相似度、等价类隶属度阈值,并初始化地震属性子集;(b)根据地震属性重要度依次评价属性有效性,并选择有效地震属性,形成最优地震属性子集。

2.如权利要求1所述的一种油气勘探地震属性自动选取方法(rsfrsd),其特征在于,所述步骤具体如以下算法:

3.rsfrsd将结果地震属性子集subfeat初始化为空集,待选地震属性子集b初始化为原始地震属性子集c。在进行运算前,采用最大最小归一化方法对地震数据集进行归一化,避免各个地震属性数据差异过大对相似度计算产生影响。rsfrsd要求样本对各个决策类的隶属度集作为输入。对于样本,依据得出与其他所有样本的模糊相似度,随后进行样本对其所属类隶属度的计算。为了充分利用样本信息,按照《说明书》定义5中式(3)计算样本的隶属度,设等价类包含的最少样本数为,将样本同类的最近个样本相似度之和与所有样本的相似度之和的比值作为样本...

【专利技术属性】
技术研发人员:李国和潘雪玲吴冠秋
申请(专利权)人:李国和
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1