基于决策树算法的海底土类型识别方法技术

技术编号:38766960 阅读:20 留言:0更新日期:2023-09-10 10:40
本发明专利技术公开了一种基于决策树算法的海底土类型识别方法,包括在线实时识别土质类型和离线构建决策树两个部分,在线实时识别土质类型的步骤如下:1)基于CPT数据计算归一化特征和修正特征;2)特征参数滤波;3)利用决策树识别海底土类型;离线构建决策树的步骤如下:1)构建训练集;2)计算训练集中数据分类的信息熵;3)计算特征参数的信息增益及信息增益率,确定根节点及其阈值;4)依据根节点特征参数的不同取值建立决策树分枝;5)设置决策树终止条件。本发明专利技术具有方法简单、实时性好、节约人力、易于实现等优点。适用于海底土类型识别。适用于海底土类型识别。适用于海底土类型识别。

【技术实现步骤摘要】
基于决策树算法的海底土类型识别方法


[0001]本专利技术涉及海洋工程、海洋资源勘探与开发、海洋调查等
,具体涉及一种基于决策树算法的海底土类型识别方法。

技术介绍

[0002]海底土质类型及特征是海洋普查与勘探的重要内容之一,是海洋石油开采、海上风电施工的重要参考指标。充分了解海底土类型及特征是开采海洋资源的前提。
[0003]通过静力触探设备(简称CPT),可获取海底土质特征信息,包括锥端阻力、侧摩阻力、孔隙水压力等。现阶段已开展了利用聚类算法、小波分析、机器学习等方法识别陆地土质类型方面的研究,在海底土类型识别方面的研究较少。
[0004]目前,海底土类型判别及分析主要通过人工完成,操作人员基于静力触探设备采集的原始测量数据及其特征,根据采集的土样描述确定土质类型。人工识别海底土质类型对操作人员的知识储备、经验丰富程度等具有较高要求,且工作效率较低,因此,这一传统方法亟需改进。

技术实现思路

[0005]本专利技术的目的是根据CPT数据自动识别海底土类型。本专利技术具有方法简单、实时性好、节约人力、易于实现等优点。适用于海底土类型识别。
[0006]本专利技术包括在线实时识别土质类型和离线构建决策树两个部分。
[0007]在线实时识别土质类型的步骤如下:
[0008](1)基于CPT数据计算归一化特征和修正特征:
[0009]应用CPT测量海底以下一定深度内的锥端阻力q
c
、侧摩阻力f
s
、孔隙水压力u2;计算修正锥端阻力q
t
=q
c
+(1

α)u2,其中,α为锥端有效面积比,由CPT设备确定;根据计算归一化锥端阻力Q
t
,其中,σ'
v0
为有效上覆压力,σ'
v0
=γ'
×
d,γ'为上覆土层平均有效容重,单位为MN/m3;摩阻比R
f
根据计算得到;孔压参数比B
q
根据计算得到,其中,d为海底以下探测位置的深度,u0=γ
w
×
d,γ
w
为海水或泥浆容重,单位为KN/m3;归一化摩阻比F
r
根据计算得到,γ'和γ
w
为参数,在测试中由人工给定;
[0010](2)特征参数滤波:
[0011]对特征参数B
q
、R
f
、Q
t
、F
r
进行中值滤波,得到滤波后的特征参数;
[0012](3)利用决策树识别海底土类型:
[0013]将滤波后的特征参数输入决策树,根据决策树给出的决策规则,判定该特征参数
对应的海底土类型,其中,决策树根据训练数据集离线构建。
[0014]离线构建决策树的步骤如下:
[0015](1)构建训练集:
[0016]中值滤波后的B
q
、R
f
、Q
t
、F
r
及其对应的参考海底土质类型构成训练数据集,其中,参考海底土质类型由人工根据采集的土样确定;
[0017](2)计算训练集中数据分类的信息熵:
[0018]设S为含有n个训练样本的数据集,训练集中参考海底土质类型数为m,海底土质类型集合为{S1,S2,

,S
i


,S
m
},第i种土质类型含有的样本数为n
i
,土质类型S
i
出现的概率p
i
根据计算,将S划分为m个土质类型的信息熵I根据计算,i=1,2,

,m;
[0019](3)计算特征参数的信息增益及信息增益率,确定根节点及其阈值:
[0020]选取训练数据集的某一特征参数A,寻找该属性的最小值min和最大值max;将特征参数A从小到大排列,根据特征参数A的两个区间[min,λ]和[λ,max],将数据集S对应划分为两个子集D
j
(j=1,2),λ为二分断点,D
j
的样本数为d
j
,D
j
中属于子集S
i
的样本数为d
ij
,D
j
中第i类的概率为p
ij
,根据计算,D
j
的信息熵I
j
根据计算,A的熵Entropy(A)根据计算,根据特征参数A划分D
j
的信息增益Gain(A)根据Gain(A)=I

Entropy(A)计算;将λ从特征参数A的min到max依次滑动取值,计算不同λ取值下的Gain(A),并记Gain(A)的最大值为Gain(A)
max
,Gain(A)
max
对应的λ值为特征参数A的阈值;特征参数A的信息增益率GainRatio(A)根据计算;依次计算所有特征参数的信息增益率,最大信息增益率对应的特征参数作为根节点;
[0021](4)依据根节点特征参数的不同取值建立决策树分枝:
[0022]采用递归的方法,以选择信息增益率最大的特征参数作为当前节点的确定标准,对分支节点不断进行划分,直到所有的分枝节点中的子集中的数据的土质类别相同,由此构造完成一棵决策树;
[0023](5)设置决策树终止条件:
[0024]当实际准确率大于或等于期望准确率时,构建的决策树即为海底土类型识别的决策树,其中,期望准确率由人工设定。
附图说明
[0025]图1为CPT18井CPT测量参数q
c
、f
s
、u2随深度变化曲线图;
[0026]图2为CPT18井特征参数B
q
、R
f
、Q
t
、F
r
随深度变化曲线图;
[0027]图3为CPT18井特征参数B
q
、R
f
、Q
t
、F
r
滤波后随深度变化曲线图;
[0028]图4为CPT18测试集分类结果与参考土质类型对比图;
[0029]图5为CPT数据集整体分类结果与参考土质类型对比图;
[0030]图6为训练集中不同土质类型出现的概率图;
[0031]图7为期望准确率为80%时基于CPT18训练集生成的决策树;
[0032]图8为期望准确率为75%时基于CPT训练集生成的决策树;
[0033]图9为期望准确率为80%时基于CPT训练集生成的决策树;
[0034]图10为期望准确率为85%时基于CPT训练集生成的决策树;
[0035]图11为期望准确率为90%时基于CPT训练集生成的决策树。
具体实施方式<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树算法的海底土类型识别方法,其特征在于能够根据CPT数据自动识别海底土类型,包括如下步骤:(1)基于CPT数据计算归一化特征和修正特征:应用CPT测量海底以下一定深度内的锥端阻力q
c
、侧摩阻力f
s
、孔隙水压力u2;计算修正锥端阻力q
t
=q
c
+(1

α)u2,其中,α为锥端有效面积比,由CPT设备确定;根据计算归一化锥端阻力Q
t
,其中,σ'
v0
为有效上覆压力,σ'
v0
=γ'
×
d,γ'为上覆土层平均有效容重,单位为MN/m3;摩阻比R
f
根据计算得到;孔压参数比B
q
根据计算得到,其中,d为海底以下探测位置的深度,u0=γ
w
×
d,γ
w
为海水或泥浆容重,单位为KN/m3;归一化摩阻比F
r
根据计算得到,γ'和γ
w
为参数,在测试中由人工给定;(2)特征参数滤波:对特征参数B
q
、R
f
、Q
t
、F
r
进行中值滤波,得到滤波后的特征参数;(3)利用决策树识别海底土类型:将滤波后的特征参数输入决策树,根据决策树给出的决策规则,判定该特征参数对应的海底土类型,其中,决策树根据训练数据集离线构建。2.权利要求1所述的决策树离线构建方法,包括如下步骤:(1)构建训练集:中值滤波后的B
q
、R
f
、Q
t
、F
r
及其对应的参考海底土质类型构成训练数据集,其中,参考海底土质类型由人工根据采集的土样确定;(2)计算训练集中数据分类的信息熵:设S为含有n个训练样本的数据集,训练集中参考海底土质类型数为m,海底土质类型集合为{S1,S2,

,S
i<...

【专利技术属性】
技术研发人员:王微微史文怡韩梦璇乔文洵
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1