一种基于模糊建模的隧道掘进数据缺失值插补方法技术

技术编号：36111777 阅读：26 留言：0更新日期：2022-12-28 14:14

一种基于模糊建模的隧道掘进数据缺失值插补方法，通过模糊建模的方法，对不完整掘进数据集进行缺失值插补。首先，对掘进数据进行采集，再对数据集进行检测是否包含缺失值。若为不完整数据集，将其通过模糊聚类的方法进行划分，划分为若干个模糊线性子集，并且通过拉格朗日乘子法迭代优化获取聚类后簇原型、单属性在各个子集的前件参数和预插补数据集。然后，基于该预插补数据集利用最小二乘法求解聚类簇中的后件参数。之后，再计算每个子集的输出并进行加权求和得到系统的全局输出。最后，使用缺失样本相应的模型输出值代替预插补值，当所有预插补值都被替换，则得到最终的插补数据集。据集。据集。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模糊建模的隧道掘进数据缺失值插补方法

[0001]本专利技术属于数据处理
，涉及一种基于模糊建模的隧道掘进数据缺失值插补方法。

技术介绍

[0002]盾构机是隧道建设施工中的重要机械装备，对于提升施工效率、保障作业安全具有十分重要的意义。然而，在盾构运行实测数据采集过程中，由于设备故障、存储错误、人为因素等多种原因，数据缺失问题无法完全避免。数据中缺失值的存在不仅会影响数据集的完整性还会降低数据挖掘的可靠性。因此，如何对缺失值进行有效处理，是实现数据与装备有机融合和推进掘进装备智能化过程中亟待解决的问题。
[0003]目前，缺失数据处理的方法一般是直接删除包含缺失值的样本或用属性均值对缺失样本进行填补。然而，上述处理方法太过简单粗暴，当缺失数据过多时不仅会进一步增加数据建模难度，还会产生不可信的分析结果。相较于上述方法，采样人工智能算法对不完整数据集进行有效分析，推导出尽可能合理的近似值，以此获得一个与原始数据集规模相同的插补数据集，更有利于后续的数据挖掘和分析。基于人工智能算法的这类方法主要是对不完整数据建模，从数据中提取有效信息，并使用它来估计缺失值。现实世界中所获取的数据集，属性间大多为非线性关系。模糊控制理论，由于其能对复杂的系统做出较为合理的估计，而被广泛应用于非线性系统分析。该理论的基本思想是将非线性系统划分成多个线性系统，然后利用隶属度函数将各个线性模型依次连接起来，形成完整的非线性模型。盾构机掘进系统各性能指标之间的相关性十分复杂，具有高度非线性的特点。因此，模糊建模方法十分适用...

【技术保护点】

【技术特征摘要】
1.一种基于模糊建模的隧道掘进数据缺失值插补方法，其特征在于，具体步骤如下：(1)、采集掘进运行实测数据集，将采集后的数据集利用软件MATLAB进行读取，然后用软件中的isnan函数来判断数据中是否存在缺失值，若存在缺失值，则该数据集为待插补的不完整数据集矩阵X＝{x1,x2,
…
,x
n
}∈R
s
，其中，n表示样本个数，R表示输入空间，s表示样本属性个数，向量x
i
＝[x
i1
,x
i2
,
…
,x
is
]
T
(i＝1,2,
…
,n)表示第i个样本，T表示向量的转置；模糊聚类的目标函数如公式(1)，聚类的约束公式如公式(2)；模糊聚类的目标函数如公式(1)，聚类的约束公式如公式(2)；其中，U表示划分矩阵，大小为n行K列，V表示原型矩阵，大小为K行s列，u
ik
表示隶属度，v
k
表示第k个聚类簇的中心，k＝1,2,
…
,K，K表示模糊子集个数，z∈(1,∞)表示模糊化参数；利用拉格朗日乘子法对划分矩阵和原型矩阵进行求解；拉格朗日函数求解公式为(3)；公式(3)的满足极小值的必要条件为公式(4)、公式(5)和公式(6)；公式(3)的满足极小值的必要条件为公式(4)、公式(5)和公式(6)；公式(3)的满足极小值的必要条件为公式(4)、公式(5)和公式(6)；公式(3)的满足极小值的必要条件为公式(4)、公式(5)和公式(6)；其中，向量λ＝[λ1,λ2,
…
,λ
n
]
T
表示拉格朗日乘子，v
t
表示第t个聚类簇的中心，t＝1,2,
…
,k；通过迭代优化公式(4)、公式(5)和公式(6)，获得原型矩阵V、划分矩阵U和预插...

【专利技术属性】
技术研发人员：宋学官，王一棠，庞勇，张立勇，孙伟，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人