一种基于随机紧凑高斯核函数的粮食作物病害预测方法技术

技术编号:23605634 阅读:45 留言:0更新日期:2020-03-28 06:29
本发明专利技术涉及一种粮食作物病害预测方法,尤其是一种基于支持向量机的随机紧凑高斯核的粮食作物病害预测方法,属于机器学习在粮食的预测技术领域。本发明专利技术在传统单尺度高斯核函数的支持向量机的基础上,扩展了高斯核函数的参数,提出的多尺度高斯核支持向量机,能够对其中的核函数参数随机化赋值,提升了支持向量机参数选择的效率。通过在粮食作物大豆病害标准数据集Soybean上的实验表明,与传统单尺度高斯核函数的支持向量机相比,该方法不仅能够提升大豆病害数据预测的精度,学习模型参数选取的时间仅需传统SVM高斯核方法的不到1%的时间。

A prediction method of crop diseases based on stochastic compact Gaussian kernel function

【技术实现步骤摘要】
一种基于随机紧凑高斯核函数的粮食作物病害预测方法
本专利技术涉及一种粮食作物病害预测方法,特别是一种基于随机紧凑高斯核函数的粮食作物病害预测方法。
技术介绍
粮食作物作为我国最主要的经济作物之一,对我们的日常生活有着非常重要的作用。由于气候变化等因素的影响,粮食作物很容易感染各种类型的病害。例如,大豆在生长过程中所面临的病害主要有根腐病、菌核病、灰斑病、霜霉病、紫斑病等数十种。病害预防不及时会致使大豆产量降低,产生大量的经济损失。因此,粮食作物病害的诊断检测是一项重要且紧迫的工作。针对粮食作物病害的传统检测方法是靠人类感官判断,不仅效率低、准确率差且难度大,需要检测人员具备较强的专业知识或经验,难以大范围推广。生物学和化学的检测方法在病害检测中的应用也较多,但是这种检测方法对检测样品的精度以及检测者的操作技术要求都很高,且成本高、耗时长、对样品产生破坏较多,还容易造成环境污染。随着科技的发展,计算机智能识别机器学习技术逐渐被应用于粮食作物病害的自动诊断与防治领域,支持向量机SVM是近年应用于分类问题和回归问题上最成功的学习机器之一。对于分类问题,由于大多数样本点在原始空间中是线性不可分的,SVM采用非线性映射的方法,将原始空间样本的输入向量x映射到高维特征空间φ(x)中,使样本在高维空间中线性可分。由于输入向量在特征空间中的内积主要利用核函数来度量,使用不同的核函数会映射到不同的特征空间,所以核函数类型的确定以及核参数的选择是影响SVM泛化性能的主要因素。当前对于参数选择的方法主要有两种:首先是基于测试精度的方法,通过测试非训练样本在某个参数值上的错误率,然后不断修正参数使错误率更小。具体的技术有Doan提出的十折交叉验证法(10-CrossValidation),但是这种方法在参数空间较大的时候花费的计算代价太大,研究学者们将现有的一些优化技术集成到参数选择的方法中,如粒子群优化(ParticleSwarmOptimization,简称PSO)方法和基因算法;其次是基于某种理论界的逼近方法,如基于影响函数(InfluenceFunction)的估计和VC维的界。上述技术在一定的程度上缓解了模型选择的问题,但是没有从根本上解决问题。对于一个学习算法,训练速度快,泛化能力强和不用调节太多的参数是各个应用领域所追求的理想情况。然而这几方面在SVM身上是矛盾的,追求训练速度就得牺牲泛化性能,追求泛化性能就得花费大量时间来选择最优的模型。高斯核函数是SVM学习器最常使用的核函数之一,训练样本的每个特征对分类的贡献是不同的,所有特征都设置相同的核参数,则难以区分每个特征的贡献度。当训练样本的特征数目较少时,设置一个核函数参数对训练模型影响较小。当训练样本特征数目较多时,应该对每个特征都设置相应的核函数参数。但是如果核函数参数较多时,使用上述提到的模型选择方法计算代价非常巨大,且很难找到符合样本实际分布的最佳参数组合。因此,现有技术中尚无一种基于随机紧凑高斯核函数的粮食作物病害预测方法。
技术实现思路
本专利技术所解决的技术问题在于提供一种基于随机紧凑高斯核函数的粮食作物病害预测方法。实现本专利技术目的的技术解决方案为:一种基于随机紧凑高斯核函数的粮食作物病害预测方法,包括以下步骤:步骤1、建立粮食作物病害数据样本集;步骤2、确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)的最优值,其中C为SVM训练模型的惩罚系数参数,σ为SVM训练模型的核参数;步骤3、利用最优参数组合(C,σ)的支持向量机SVM训练模型测试数据样本集,得到粮食作物病害的种类。优选的,所述步骤1中粮食作物病害数据样本集为:其中xi∈Rd为影响粮食作物病害症状的数据,ti∈{-1,1}为类别,包括正类和负类,Rd为d维特征个数,N为数据样本的个数。优选的,所述步骤2确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)的最优值具体为:步骤2-1、将粮食作物数据样本集S划分为训练集Strain和测试集Stest;步骤2-2、确定支持向量机SVM训练模型的核函数及其参数σ;步骤2-3、从候选集T中选择一个元素作为支持向量机SVM训练模型的参数C,然后从候选集T删去该元素,所述候选集T是指候选参数集合;步骤2-4、计算支持向量机SVM训练模型的核矩阵K(xi,xj),其中,xi,xj为影响粮食作物病害症状的数据,i=1,…,N,j=1,…,N;步骤2-5、确定使支持向量机SVM训练模型对偶优化的最优解,所用公式为:Minimize:Subjectto:其中为SVM的核函数,是对x做变换的函数,将样本映射到更高维的空间,αi为非负拉格朗日乘子,每个拉格朗日乘子αi对应着一个训练样本(xi,ti),ti为粮食作物病害数据的类别;步骤2-6、求解法向量w和偏置b,所用公式为:式中w为SVM的权值向量,b为SVM的阈值;步骤2-7、确定支持向量机SVM训练模型f(x),模型公式为:式中sgn为符号函数,返回参数的正负;步骤2-8、使用支持向量机SVM训练模型f(x)对测试集Stest进行预测,得到预测准确率Ak,其中k为第k次迭代;之后执行步骤2-3,直至候选集T为空;步骤2-9、从集合A=[A1,…Ak,…]中找出最大值,并标记出相应的参数C的值,从而确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)。优选的,所述步骤2-1中将粮食作物数据样本集S划分为训练集Strain和测试集Stest的划分策略为:将样本集S中前n个样本设为训练集Strain,其它样本作为测试集Stest。优选的,所述步骤2-2中SVM的核函数采用高斯多尺度核函数,其形式为:其中σ=[σ1,…,σd]为核函数的参数,为d维向量,x,z∈Rd分别为影响粮食作物病害症状的样本,且x=[x1,…,xd],z=[z1,…,zd]。优选的,所述步骤2-2确定支持向量机SVM训练模型的核函数及其参数σ采用随机赋值方法,具体为:步骤2-2-1、从区间(0,1)内随机生成均匀分布的随机向量σ;步骤2-2-2、设置σ=d×σ,其中d为样本集S中特征的数目。优选的,所述步骤2-3中候选集T为用户设置的候选参数集合,设为T=[1,10,100,1000,10000,100000]。优选的,所述步骤2-5中SVM的对偶优化问题是由SVM的初始优化问题转换得到,SVM的初始优化问题如下式所示:Minimize:Subjectto:ξi≥0,i=1,...,N其中C为用户需要调节的参数,作用是调节分类间隔和训练错误两者的权重;映射函数的作用是将输入向量xi映射到特征空间Z,w是垂直于超平面的法向量。本专利技术与现有技术相比,其显著优点为:1)本专利技术扩充本文档来自技高网
...

【技术保护点】
1.一种基于随机紧凑高斯核函数的粮食作物病害预测方法,其特征在于,包括以下步骤:/n步骤1、建立粮食作物病害数据样本集;/n步骤2、确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)的最优值,其中C为SVM训练模型的惩罚系数参数,σ为SVM训练模型的核参数;/n步骤3、利用最优参数组合(C,σ)的支持向量机SVM训练模型测试数据样本集,得到粮食作物病害的种类。/n

【技术特征摘要】
1.一种基于随机紧凑高斯核函数的粮食作物病害预测方法,其特征在于,包括以下步骤:
步骤1、建立粮食作物病害数据样本集;
步骤2、确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)的最优值,其中C为SVM训练模型的惩罚系数参数,σ为SVM训练模型的核参数;
步骤3、利用最优参数组合(C,σ)的支持向量机SVM训练模型测试数据样本集,得到粮食作物病害的种类。


2.根据权利要求1所述的基于随机紧凑高斯核函数的粮食作物病害预测方法,其特征在于,步骤1中粮食作物病害数据样本集为:



其中xi∈Rd为影响粮食作物病害症状的数据,ti∈{-1,1}为类别,包括正类和负类,Rd为d维特征个数,N为数据样本的个数。


3.根据权利要求1所述的基于随机紧凑高斯核函数的粮食作物病害预测方法,其特征在于,步骤2确定支持向量机SVM训练模型在粮食作物病害数据样本集上的参数组合(C,σ)的最优值具体为:
步骤2-1、将粮食作物数据样本集S划分为训练集Strain和测试集Stest;
步骤2-2、确定支持向量机SVM训练模型的核函数及其参数σ;
步骤2-3、从候选集T中选择一个元素作为支持向量机SVM训练模型的参数C,然后从候选集T删去该元素,所述候选集T是指候选参数集合;
步骤2-4、计算支持向量机SVM训练模型的核矩阵K(xi,xj),其中,xi,xj为影响粮食作物病害症状的数据,i=1,...,N,j=1,...,N;
步骤2-5、确定使支持向量机SVM训练模型对偶优化的最优解,所用公式为:






其中为SVM的核函数,是对x做变换的函数,将样本映射到更高维的空间,αi为非负拉格朗日乘子,每个拉格朗日乘子αi对应着一个训练样本(xi,ti),ti为粮食作物病害数据的类别;
步骤2-6、求解法向量w和偏置b,所用公式为:



式中w为SVM的权值向量,b为SVM的阈值;
步骤2-7、确定支持向量机SVM训练模型f(x),模型公式为:



式中sgn为符号函数,返回参数的正负;
步骤...

【专利技术属性】
技术研发人员:丁晓剑程伟刘健杨帆曹杰
申请(专利权)人:南京财经大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1