基于改进支持向量机核函数的植物叶片分类方法及系统技术方案

技术编号:27417864 阅读:26 留言:0更新日期:2021-02-21 14:35
本发明专利技术涉及一种基于改进支持向量机核函数的植物叶片分类方法及系统,该方法包括:1、获取叶片形状的时间序列数据集,并分为训练数据集、训练标签集、待分类数据集;2、将训练数据集中的样本与空间基数据两两计算样本之间的时间序列互相关距离,构建新特征空间中的训练样本数据;3、将待分类数据集中的样本与空间基数据两两计算样本之间的时间序列互相关距离,构建新特征空间中的待分类样本数据;4、计算改进的线性核函数,然后用其与训练标签集构建SVM分类模型;5、将待分类样本数据输入到构建的SVM分类模型中进行分类,获得数据分类结果。该方法及系统有利于快速、准确地对植物叶片进行分类,进而对植物物种进行识别。进而对植物物种进行识别。进而对植物物种进行识别。

【技术实现步骤摘要】
基于改进支持向量机核函数的植物叶片分类方法及系统


[0001]本专利技术属于叶片分类
,具体涉及一种基于改进支持向量机核函数的植物叶片分类方法及系统。

技术介绍

[0002]叶片分类是植物自动检索中的一项关键技术,它根据叶片的形状、纹理、颜色等特征进行植物生物物种的自动标注。与颜色和纹理相比,植物叶片的形状更具有代表性,且容易转化为数学模型进行计算。
[0003]近年来,在基于植物叶片图像的植物分类等方面的研究不断取得进展,包括叶片图像的特征选取、算法性能和分类器设计等。很多学者对叶片分类课题进行了研究,例如,付波等人为解决由于植物叶片特征的相似性以及叶片旋转导致植物识别率较低的问题,提出一种基于降维局部二值模式(LBP)与叶片形状特征相结合的植物叶片识别方法。马娜等人首先对叶片图像预处理,提取6个特征值,然后再使用基于布谷鸟算法改进的支持向量机算法建立分类模型对植物叶片分类,从而识别植物物种。董红霞等人提出了一种基于形状与纹理特征的分类算法。在进行了去噪等预处理后,通过阈值分割和数学形态学方法获取叶片区域;在分割得到的二值区域图像上提取了形状特征,在灰度图像上提取了纹理特征;在所得特征的基础上,利用BP网络对叶片进行分类。
[0004]在叶片分类算法中,一般情况下将叶片图像进行预处理,然后对图形进行边缘检测,获得二值化图像并转化为一条n维的时间序列数据,最后根据时间序列数据建立相应的分类模型。支持向量机(SVM)是Vapnik等人提出了一种建立在统计学习理论的基础上的数据挖掘方法。在众多的机器学习算法中,支持向量机作为一种分类效果和稳定性较好的机器学习算法得到了广泛应用。许多学者将SVM算法运用时间序列数据的分类工作中,张坤华等人针对多变量时间序列定义了每个属性的局部密度和判别距离,根据决策图的分布来筛选属性,最终通过SVM对数据进行分类。张振国等人以子序列为单位,构建时序数据间的相似性向量,快速筛选出具有高分类能力的Shapelets集合,并使用SVM算法进行分类。传统的SVM算法一般应用于时间序列数据分类的最后阶段,即对降维或者转化操作后的时间序列数据进行分类。

技术实现思路

[0005]本专利技术的目的在于提供一种基于改进支持向量机核函数的植物叶片分类方法及系统,该方法及系统有利于快速、准确地对植物叶片进行分类,进而对植物物种进行识别。
[0006]为实现上述目的,本专利技术采用的技术方案是:一种基于改进支持向量机核函数的植物叶片分类方法,包括以下步骤:
[0007]步骤1:对多个植物叶片图片进行处理,获取叶片形状的时间序列数据集,然后将获得的时间序列数据集分为训练数据集D
tr
(m
×
v)、训练标签集L
tr
(m
×
1)、待分类数据集D
te
(n
×
v),其中m为训练集中样本个数,n为待分类数据集中样本个数,v为数据的维数;
[0008]步骤2:将训练数据集D
tr
中的样本与空间基数据D
tr
两两计算样本之间的时间序列互相关距离,构建m
×
m的新特征空间中的训练样本数据Dist(D
tr
,D
tr
);
[0009]步骤3:将待分类数据集D
te
中的样本与空间基数据D
tr
两两计算样本之间的时间序列互相关距离,构建n
×
m的新特征空间中的待分类样本数据;
[0010]步骤4:利用新的特征空间数据Dist(D
tr
,D
tr
)计算改进的线性核函数,然后使用改进的线性核函数与训练标签集L
tr
构建SVM分类模型;
[0011]步骤5:将n
×
m的新特征空间中的待分类样本数据输入到构建的SVM分类模型中进行分类,获得数据分类结果。
[0012]进一步地,所述步骤1中,获取叶片形状的时间序列数据集的具体方法为:
[0013]对植物叶片图片进行图像预处理,即对图像进行灰度化、去噪、二值化和边缘提取,然后通过求取叶片形状的中心位置,获得叶片形状边缘到达中心位置的距离,按照一定的时间间隔Δt采集叶片形状边缘到中心点之间的距离数据,最终获得一条维度为v的时间序列数据,所述时间序列数据是一个有序的信息集合,表示为X={x1,x2,

,x
v
},其中,时间序列数据的采样间隔为Δt=t(x
i
)-t(x
i-1
);
[0014]对多个植物叶片图片进行处理,相应得到多条时间序列数据,进而得到叶片形状的时间序列数据集。
[0015]进一步地,所述步骤2中,计算样本之间的时间序列互相关距离的具体方法为:
[0016]让一个时间序列保持静止,另一个序列在静止序列上滑动,通过平移找到互相关的最大值,即为两个时间序列的相似性;对于时间序列数据x=(x1,x2,

,x
m
)与时间序列数据y=(y1,y2,

,y
m
),序列x位移w个位置后与静止序列y的互相关函数如公式(1)所示:
[0017][0018]其中,w∈{-m,-m+1,

,0,

,m-1,m},w≥0时,表示x序列向右移动w个位置,w<0时,表示x序列向左移动w个位置,移动后空余的位置由0替代;
[0019]找到一个最优的位移w,使得C(x,y,w)的值最大,也就找到了x相对于y最好的位移;
[0020]时间序列互相关距离,即时间序列x与序列y的互相关距离如公式(2)所示:
[0021][0022]两个时间序列之间的互相关数值范围限定到[0,2]之间,数值越大,越不相似,数值越小,越相似。
[0023]进一步地,利用公式(2)计算训练数据集D
tr
与空间基数据D
tr
中两两样本之间的时间序列互相关距离dist(x
i
,y
j
),构建得到m
×
m的新特征空间中的训练样本数据,即新的特征空间数据Dist(D
tr
,D
tr
)如下:
[0024][0025]进一步地,将线性核函数与新的特征空间数据结合,计算改进的线性核函数K(X,X)如下:
[0026]K(X,X)=Dist(D
tr
,D
tr
)
·
Dist(D
tr
,D
tr
)。
[0027]本专利技术还提供了一种基于改进支持向量机核函数的植物叶片分类系统,包括存储器、处理器以及存储于存储器上并能够在处理器上运行的计算机程序,当处理器运行该计算机程序时,实现如权利要求1-5任一项本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进支持向量机核函数的植物叶片分类方法,其特征在于,包括以下步骤:步骤1:对多个植物叶片图片进行处理,获取叶片形状的时间序列数据集,然后将获得的时间序列数据集分为训练数据集D
tr
(m
×
v)、训练标签集L
tr
(m
×
1)、待分类数据集D
te
(n
×
v),其中m为训练集中样本个数,n为待分类数据集中样本个数,v为数据的维数;步骤2:将训练数据集D
tr
中的样本与空间基数据D
tr
两两计算样本之间的时间序列互相关距离,构建m
×
m的新特征空间中的训练样本数据Dist(D
tr
,D
tr
);步骤3:将待分类数据集D
te
中的样本与空间基数据D
tr
两两计算样本之间的时间序列互相关距离,构建n
×
m的新特征空间中的待分类样本数据;步骤4:利用新的特征空间数据Dist(D
tr
,D
tr
)计算改进的线性核函数,然后使用改进的线性核函数与训练标签集L
tr
构建SVM分类模型;步骤5:将n
×
m的新特征空间中的待分类样本数据输入到构建的SVM分类模型中进行分类,获得数据分类结果。2.根据权利要求1所述的基于改进支持向量机核函数的植物叶片分类方法,其特征在于,所述步骤1中,获取叶片形状的时间序列数据集的具体方法为:对植物叶片图片进行图像预处理,即对图像进行灰度化、去噪、二值化和边缘提取,然后通过求取叶片形状的中心位置,获得叶片形状边缘到达中心位置的距离,按照一定的时间间隔Δt采集叶片形状边缘到中心点之间的距离数据,最终获得一条维度为v的时间序列数据,所述时间序列数据是一个有序的信息集合,表示为X={x1,x2,

,x
v
},其中,时间序列数据的采样间隔为Δt=t(x
i
)-t(x
i-1
);对多个植物叶片图片进行处理,相应得到多条时间序列数据,进而得到叶片形状...

【专利技术属性】
技术研发人员:李翔宇曾燕清李瑞兴王华尹小俊周原
申请(专利权)人:闽江师范高等专科学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1