System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种大样本集内信息跨邻域保真传递方法技术_技高网

一种大样本集内信息跨邻域保真传递方法技术

技术编号:41391739 阅读:7 留言:0更新日期:2024-05-20 19:14
本发明专利技术公开了一种大样本集内信息跨邻域保真传递方法,包括如下步骤:S1:获取大样本数据集,并标注学习样本和标签;S2:对整个大样本集禀赋提升与规整化处理,包括大样本集的样本提升、优化与降噪处理,以及建立样本精确校准与确信样本库;S3:构建样本数据结构的智能学习模型,包括针对样本信息结构的特征工程和针对样本结构预测的神经网络模型;S4:基于逐级划分架构的跨邻域保真循环传递,包括样本信息跨邻域传递与确信样本信息库循环更新,以及逐级划分架构下信息的大样本集内循环保真传递。本发明专利技术能够突破地质区域限制或时间限制,进行样本信息的稳定、保真预测与传递。

【技术实现步骤摘要】

本专利技术涉及大数据,尤其涉及一种大样本集内信息跨邻域保真传递方法


技术介绍

1、随着信息技术的快速发展,数据量呈现爆炸式增长,在大数据时代背景下,神经网络学习预测过程中如何从大规模、高维度和密集分布的样本数据集中提取有效特征信息并在样本点间保真传递样本的特征信息,成为了神经网络面对大规模预测数据领域面临的重大挑战。

2、尤其是在地质勘探领域中,在处理这些大样本数据集的信息传递时,传统的方法往往面临样本的非均质性、噪声干扰、大量样本下效率低下的问题从而导致预测结果与现实情况差强人意。此外,由于数据的密集性,传统方法在提取少量样本内部信息的结构特征,对其他样本点做出预测时,往往无法保持原样本数据的特征信息,导致原始样本点信息向远处传递的不准确或失真。


技术实现思路

1、针对上述技术问题,本专利技术的目的是提供一种大样本集内信息跨邻域保真传递方法,旨在提高大样本集中信息传递的效率和准确性,同时保持信息的保真性,通过该方法能够有效处理大规模数据集,并确保在不同数据邻域间的信息传递不受数据分布差异的影响。

2、本专利技术的目的是采用以下技术方案实现的:一种大样本集内信息跨邻域保真传递方法,包括如下步骤:

3、s1:获取大样本数据集,并标注学习样本和标签;

4、s2:对整个大样本集禀赋提升与规整化处理,包括大样本集的样本提升、优化与降噪处理,以及建立样本精确校准与确信样本库;

5、s3:构建样本数据结构的智能学习模型,包括针对样本信息结构的特征工程和针对样本结构预测的神经网络模型;

6、s4:基于逐级划分架构的跨邻域保真循环传递,包括样本信息跨邻域传递与确信样本信息库循环更新,以及逐级划分架构下信息的大样本集内循环保真传递。

7、进一步的,步骤s1包括如下子步骤:

8、s11:获取大样本数据集,所述大样本数据集包括地震资料和测井资料;

9、s12:将测井资料中测井的地层分层信息作为标签,井旁地震道地震资料与测井深度数据作为学习样本,通过神经网络学习地层分层信息与地震资料对应关系,对整个地质勘探区块地层分层信息进行预测。

10、进一步的,步骤s2包括如下子步骤:

11、s21:对获取的原始大样本数据集进行样本提取、优选和降噪,得到干净的大样本数据集;

12、s22:将学习样本与标签对应的实际应用模型进行校准,得到确信学习样本,并建立可植入可更新的确信样本库,作为神经网络模型的学习样本集。

13、进一步的,步骤s21包括如下子步骤:

14、s211:对获取的原始大样本数据集进行读取和筛选,提取相关样本数据,转化为目标数据类型,并进行标签与样本的标注,得到粗糙大样本集;

15、s212:利用敏感性算法筛选提取粗糙大样本集中的多种样本类型,得到对预测目标预设敏感性的优选样本种类;

16、s213:对筛选后的样本进行降噪处理,得到干净的大样本数据集。

17、进一步的,步骤s3包括如下子步骤:

18、s31:对样本信息进行特征变换,得到切合目标样本集的特征工程手段;

19、s32:围绕特征工程处理后的学习样本的数据结构,建立bert+bilstm+crf神经网络模型,并调节模型参数以及各个特征权重,优化模型网络结构,以将网络模型对测试样本预测达到预设标准的准确率。

20、进一步的,步骤s31具体为:对样本信息进行特征变换,并对不同样本特征进行特征交叉,对不同特征工程手段结果与标签利用不同相关性算法进行分析,得到切合目标样本集的特征工程手段。

21、进一步的,步骤s4包括如下子步骤:

22、s41:利用训练完成后的神经网络模型跨过邻域样本点,对远处目标样本点进行预测,并更新学习样本;

23、s42:将所要预测大样本集在平面二维空间标定,划定包含大样本集中所有样本点位置的矩形区块,利用逐级划分的方法将目标区块所在矩形按照契合的划分方式,通过多轮划分,划分成多个子网格,在每一轮划分结束后,跨过样本点邻域样本集,利用训练完成后的神经网络模型对划分后的子区块中心点样本循环进行预测、修正、更新和预测操作,跨过样本点邻域样本集,达到样本点信息逐级向不同轮次块中心传递目的。

24、进一步的,步骤s41具体为:利用训练完成后的神经网络模型跨过邻域样本点,对远处目标样本点进行预测,对预测结果进行评价并修正,将跨邻域预测并分析修正后的远处目样本点植入确信样本库,更新神将网络模型学习样本。

25、本专利技术的有益效果在于:本专利技术可使得神经网络模型在对大样本数据集的预测过程中,尤其是对在地质勘探领域的预测中,能够突破地质区域限制或时间限制,进行样本信息的稳定、保真预测与传递。

本文档来自技高网...

【技术保护点】

1.一种大样本集内信息跨邻域保真传递方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S1包括如下子步骤:

3.如权利要求2所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S2包括如下子步骤:

4.如权利要求3所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S21包括如下子步骤:

5.如权利要求4所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S3包括如下子步骤:

6.如权利要求5所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S31具体为:对样本信息进行特征变换,并对不同样本特征进行特征交叉,对不同特征工程手段结果与标签利用不同相关性算法进行分析,得到切合目标样本集的特征工程手段。

7.如权利要求6所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S4包括如下子步骤:

8.如权利要求7所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤S41具体为:利用训练完成后的神经网络模型跨过邻域样本点,对远处目标样本点进行预测,对预测结果进行评价并修正,将跨邻域预测并分析修正后的远处目样本点植入确信样本库,更新神将网络模型学习样本。

...

【技术特征摘要】

1.一种大样本集内信息跨邻域保真传递方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤s1包括如下子步骤:

3.如权利要求2所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤s2包括如下子步骤:

4.如权利要求3所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤s21包括如下子步骤:

5.如权利要求4所述的一种大样本集内信息跨邻域保真传递方法,其特征在于,步骤s3包括如下子步骤:

6.如权利要求5所述的一种大样本集内信息跨邻域保真...

【专利技术属性】
技术研发人员:欧成华肖磊李朝纯
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1