一种基于马氏距离IDTW的岩层分类方法技术

技术编号：19823877 阅读：28 留言：0更新日期：2018-12-19 15:27

本发明专利技术公开了一种基于马氏距离IDTW的岩层分类方法，步骤是：S1、获取岩层数据，并将第一次获取的岩层数据作为训练样本数据；S2、通过聚类确定训练样本类别；S3、继续提取最新岩层数据，并将之作为待分类的测试样本数据；S4、使用基于马氏距离IDTW方法，计算出待分类的测试样本数据与已确定类别的训练样本数据之间的距离；S5、计算待分类的测试样本和每个训练样本的距离，分类；S6、完成。本发明专利技术首先获取岩层训练数据及测试数据，然后采用基于马氏距离IDTW距离对岩层数据样本进行相似性度量，排除样本属性之间的相关性以及时间序列数据偏移的影响，最后结合最近邻(1‑NN)分类算法对岩层数据进行分类，实现对地下的地质结构及成分的空间分布的判定。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于马氏距离IDTW的岩层分类方法
本专利技术涉及岩层数据分类领域，特别是一种基于马氏距离IDTW的岩层分类方法。
技术介绍
岩层分类是根据一个地区的岩石客观存在的不同属性或特征，把组成这个地区的地壳的岩层划分成不同类型的地质层。只有把当地的岩层(石)构造了解清楚，对不同岩层(石)进行了准确的分类，才能很好的了解当地的地下地质结构、成分的空间分布，以及当时(历史)的地质形成过程，对今后的地质研究、地下资源勘探奠定了良好的基础。因此，获取岩层数据、分析岩层数据和分类岩层数据就显得极其重要。目前，对岩层数据进行分类研究，一般采用最近邻分类算法、支持向量机或神经网络等方法，其中，最近邻(1-NearestNeighbor,1-NN)分类算法使用较多。该分类方法是指如果一个样本在特征空间中的1个最相近(即特征空间中最邻近)的样本属于某个类别，则该样本也属于这个类别。此方法特别适合多分类问题，对于类域的交叉或重叠较多的待分样本集来说，此方法较其他方法更合适，并且其使用简单，易于实现，无需参数估计及训练。最近邻分类算法的核心在于样本间距离的计算，计算距离有多种不同的方法，曼哈顿距离、欧氏距离、汉明距离和动态时间规整距离(DTW，即DynamicTimeWarping)等，传统的DTW通过考虑数值上的相似性来对X轴(时间轴)进行规整，因此可以在一定程度上有效地解决X轴上的偏移和伸缩等问题，较前几种方法好，但是，其忽略了数据在数值轴(Y轴)上的偏移且对奇异值敏感。另外，岩层数据有其自身的特点，如：数据内容复杂，具有非线性、高维度、信息冗杂、伴随噪声等，如果直接采用经典...

【技术保护点】
1.一种基于马氏距离IDTW的岩层分类方法，其特征在于：岩层分类方法的步骤是：S1、获取岩层数据，并将第一次获取的岩层数据作为训练样本数据，该训练样本数据为多维时间序列X＝{x1,x2,x3,…,xn}，其中，xi(1≤i≤n)是序列X的第i个序列，为一个l×d的矩阵，l为时间序列的长度，d为时间序列的维度；n为序列X的长度；S2、将步骤S1中得到的训练数据样本X＝{x1,x2,x3,…,xn}通过K均值聚类或层次聚类方法，对岩层训练样本进行聚类处理，从而得到岩层样本数据的类别标签Y＝{y1,y2,y3,…,yn}，其中，聚类的类别数设为c，yj(1≤j≤n)的值由聚类结果确定；S3、继续提取最新岩层数据，并将之作为待分类的测试样本数据X'＝{x1',x2',x3',…,xm'}，其中，m为序列X'的长度；S4、使用基于马氏距离IDTW方法，计算出待分类的测试样本数据X'＝{x1',x2',x3',…,xm'}与已确定类别的训练样本数据X＝{x1,x2,x3,…,xn}之间的距离；此距离为一个矩阵

【技术特征摘要】
1.一种基于马氏距离IDTW的岩层分类方法，其特征在于：岩层分类方法的步骤是：S1、获取岩层数据，并将第一次获取的岩层数据作为训练样本数据，该训练样本数据为多维时间序列X＝{x1,x2,x3,…,xn}，其中，xi(1≤i≤n)是序列X的第i个序列，为一个l×d的矩阵，l为时间序列的长度，d为时间序列的维度；n为序列X的长度；S2、将步骤S1中得到的训练数据样本X＝{x1,x2,x3,…,xn}通过K均值聚类或层次聚类方法，对岩层训练样本进行聚类处理，从而得到岩层样本数据的类别标签Y＝{y1,y2,y3,…,yn}，其中，聚类的类别数设为c，yj(1≤j≤n)的值由聚类结果确定；S3、继续提取最新岩层数据，并将之作为待分类的测试样本数据X'＝{x1',x2',x3',…,xm'}，其中，m为序列X'的长度；S4、使用基于马氏距离IDTW方法，计算出待分类的测试样本数据X'＝{x1',x2',x3',…,xm'}与已确定类别的训练样本数据X＝{x1,x2,x3,…,xn}之间的距离；此距离为一个矩阵其中dij＝IDTWM(xi,xj')，IDTWM为xi和xj'之间基于马氏距离ITDW的距离，xi和xj'分别为已确定类别的训练样本X和测试样本X'的第i个和第j个样本；S41、两样本的局部距离计算公式为：dl(i,j)＝(w(xii)-w(xjj'))2其中，1代表时间序列X轴的数值特征，xii表示xi中第i行数据，min|Δx|表示岩层训练样本序列X中所有点的最小梯度值，为序列的梯度特征，用时间序列中相邻两点的差值来表示某一点的梯度，通过对两个特征量进行加和，将其结合在一起；岩层测试样本的w(xjj')计算同理；S42、基于马氏距离IDTW距离寻找两个样本序列xi'＝{xi1',xi2',xi3',…,xil′′}和xj＝{xj1,xj2,xj3,…,xjl'}之间的最优弯曲路径来计算马氏距离度量值IDTWM(xi',xj)，其中l'为xi'和xj的长度；采用马氏距离计算得出d(qk)：在所有的弯曲路径中，存在一条最优的路径使...

【专利技术属性】
技术研发人员：乔美英，刘宇翔，兰建义，陶慧，闫书豪，王波，
申请(专利权)人：河南理工大学，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人