一种中草药种类及不同产地的识别分类方法技术

技术编号:15437955 阅读:50 留言:0更新日期:2017-05-26 03:57
本发明专利技术公开了一种中草药种类及不同产地的识别分类方法,属于信息识别及处理领域,包括如下步骤:对中草药样本数据预处理,并把数据集分成两组,训练集数据和测试集数据;构建支持向量机SVM训练模型,确定涉及的参数组合,所述参数组合包括核函数参数和惩罚因子,训练集数据作为训练模型的输入;运用仿生搜索算法对支持向量机SVM的参数组合进行寻优;根据获取的最优参数,对模型进行优化,测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。本发明专利技术提供了一种中草药种类及不同产地的识别分类方法,具有参数设置简单、快速检测、全局搜索能力强等优点,为识别不同产地的中草药提供基础。

Identification and classification method of Chinese herbal medicine and different producing areas

The invention discloses a classification method of Chinese herbal medicine species and different habitats, which belongs to the information recognition and processing, which comprises the following steps: the Chinese herbal medicine sample data preprocessing, and the data set is divided into two groups, the training set data and test data; construct support vector machine SVM training model, determine the parameters involved the combination of the parameters, including the kernel function parameter and penalty factor, the training set as the training data input of the model; the use of bionic search algorithm to optimize the parameters of support vector machine SVM; according to the optimal parameters obtained, to optimize the model, the data of test set as optimization model input, test data, get identification and classification of Chinese herbal species and different habitats. The invention provides a classification method of Chinese herbal medicine species and different habitats, with the simple parameters, rapid detection of strong global search capability, etc., provide the basis for the identification of different origin of Chinese herbal medicine.

【技术实现步骤摘要】
一种中草药种类及不同产地的识别分类方法
本专利技术涉及信息识别及处理领域,尤其涉及一种中草药种类及不同产地的识别分类方法。
技术介绍
随着计算机技术、信息处理等的快速发展,中草药种类及不同产地的识别为中草药的品质鉴定等问题尤为重要。相关中草药的不同产地研究方式从多个方面进行开展,有效成分与生态因子间的相关性研究,有效成分间的差异性研究,中药材成分的指纹图谱研究,中草药成分分析鉴别方法研究,成分元素的波浪式分布研究,中草药不同部位的有效成分含量研究,运用高效液相色谱分析方法研究。为中草药品质鉴定提供一定的理论基础和实践工作指导经验。由于中草药实际的数据特点,支持向量机SVM中核函数及参数的人工选择具有一定的局限性和盲目性,运用仿生搜索算法解决参数优化的问题,提升分类准确率和速率。因此,提出一种中草药种类及不同产地的识别分类方法。
技术实现思路
为了克服现有技术的不足,本专利技术提出了一种中草药种类及不同产地的识别分类方法,具有参数设置简单、快速检测、全局搜索能力强等优点,为识别不同产地的中草药提供基础。本专利技术所采用的技术方案:一种中草药种类及不同产地的识别分类方法,所述方法的实现过程包括以下步骤:步骤一:对中草药样本数据集进行特征提取的预处理,特征提取后的中草药样本数据集分成两组,75%数据集作为训练集数据,25%数据集作为测试集数据;步骤二:构建支持向量机SVM训练模型,确定其涉及到的参数组合,所述参数组合包括核函数参数和惩罚因子,将所述训练集数据作为所述训练模型的输入;步骤三:运用仿生搜索算法对支持向量机SVM的参数组合进行寻优,在全局范围内获得最优解;步骤四:根据获取的最优参数,对模型进行优化,将所述测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。所述方法的实现过程步骤为:步骤一中将采集并测量得到的一个中草药样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩其中r代表训练样本矩阵的行数,由选取的样本类,样本个数及稳态时间值个数决定,j代表训练样本类别个数j∈[1,3],i代表第j类训练样本个数i∈[1,ni]。所述方法的实现过程步骤为:步骤二中采用径向基函数作为支持向量机的核函数,其形式为:其中xi、xj表示提取的中草药样本数据信息的两个不同特征向量;σ是径向基函数的宽度参数。所述方法的实现过程步骤为:步骤三中运用仿生搜索算法对支持向量机SVM的核函数参数、惩罚因子进行寻优,其具体过程步骤为:1)获取中草药样本数据集;2)确定仿生搜索初始种群个体数量number=20,最大迭代次数Maxreplace=100,在[-1,1]范围内生成生物个体的初始位置;3)赋予生物个体随机飞行方向与距离,计算生物个体所在位置与原点之间的距离Disti,获取味道浓度判定值Ci,其中i表示第i个生物个体;4)将分类准确率作为适应度函数Fitnessfunction:最佳味道浓度值Smelli=Fitnessfunction(Ci);5)找到适应度函数中最大值对应的分类准确率最高的生物个体,并保留最佳味道浓度值及其当前所在的位置;6)进入迭代寻优过程,判别最高分类准确率是否优于前一代最高分类正确率,若是则将当前最高分类准确率的位置坐标赋给初始坐标,否则返回至步骤3);判别是否达到最大迭代次数,若是则结束进程,否则返回至步骤3);7)记录最优参数,优化模型构建完毕。与现有技术相比,本专利技术的有益效果是:本专利技术运用仿生搜索算法的参数设置简单、快速检测、全局搜索能力强等特性,构建支持向量机SVM预测模型,通过参数寻优后再进行模型优化,提高了分类准确率和精度,可有效的应用到中草药种类及不同产地的识别分类。附图说明图1为中草药种类及不同产地的识别分类总体流程图。图2为仿生搜索算法对支持向量机SVM的参数寻优流程图。图3为优化模型的测试集数据样本判别图。图4为图3优化模型的测试集数据样本判别的所有待测样本相关性判别结果图。具体实施方式下面结合具体实施例进一步说明本专利技术的技术方案。1.参照附图1,按以下步骤进行:步骤1:选取安徽何首乌、广东何首乌、河南何首乌样品各100克,各备份为20份,每份为5克(g),切割成面积约1平方厘米的片状,放置在采集样品烧杯(200毫升)置于恒温(60℃)恒湿(75%)的实验箱中静置100分钟。步骤2:选取20份中的15份样品(另5份作为未知样品待检测)应用仿生嗅觉系统对已知安徽何首乌、广东何首乌、河南何首乌气味样品进行采集检测,测量时间t为100秒(S),采集速率为7.747毫升/分钟(ml/min),并将所测数据Fs(S1,S2,……SN)保存至计算机。步骤3:对步骤2中采集所得到的测量数据采用支持向量机SVM进行识别判断训练,其中径向基和函数为:其中xi、xj表示提取的中草药样本数据信息的两个不同特征向量;σ是径向基函数的宽度参数。运用仿生搜索算法对训练模型中的参数进行寻优,优化模型后再进行数据测试,得到中草药种类及不同产地的识别分类。2.所述步骤2及步骤3中使用的数据集及方法,具体步骤如下:步骤1):将采集并测量得到的15份安徽何首乌、广东何首乌、河南何首乌样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩阵其数据如下表1所示:表1训练样本矩阵PT数据其中r=45代表训练样本矩阵的行数(其中r=45=3×15×1,选取的样本类别个数j=3,每个类中样本个数i=10,每个样本稳态时间值个数为1),则训练样本的均值为步骤2):由步骤1)可得到训练样本去均值后形成的样本矩阵T=PT-μ,T∈R45×10,则T的协方差矩阵为Q=T×TT(Q∈R45×45)(2)其中TT是T的转置矩阵。3.参照附图2,根据仿生搜索算法的特点,具体步骤如下所示:步骤1:算法初始化,设定仿生搜索初始种群个体数量number=20,最大迭代次数Maxreplace=100,在[-1,1]范围内生成生物个体的初始位置坐标(X-axis,Y-axis);步骤2:赋予生物个体随机飞行方向与距离,计算生物个体所在位置与原点之间的距离Disti,获取味道浓度判定值Ci,其中i表示第i个生物个体;Xi=X-axis+RandomValue;Yi=X-axis+RandomValue步骤3:将分类准确率作为适应度函数Fitnessfunction,味道浓度判定值Ci代入其中:最佳味道浓度值Smelli=Fitnessfunction(Ci)步骤3:将分类准确率作为适应度函数Fitnessfunction,味道浓度判定值Ci代入其中:最佳味道浓度值Smelli=Fitnessfunction(Ci);步骤4:找到适应度函数中最大值对应的分类正确率最高的生物个体,并保留最佳味道浓度值及其当前所在的位置,此时生物群体向该位置移动,每隔固定距离d记录途径位置上的气味浓度值:Smellbest=bestSmellX-axis=X(bestIndex);Y-axis=Y(bestIndex)步骤5:进入迭代寻优过程,判别最高分类准确率是否优于前一代最高分类正确率,若是则将当前最高分类准确率的位置坐标赋给初始坐标,否则返回至步骤2;判别是否达到最大迭代次数,若是则结束进程,否本文档来自技高网...
一种中草药种类及不同产地的识别分类方法

【技术保护点】
一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程包括以下步骤:步骤一:对中草药样本数据集进行特征提取的预处理,特征提取后的中草药样本数据集分成两组,75%数据集作为训练集数据,25%数据集作为测试集数据;步骤二:构建支持向量机SVM训练模型,确定其涉及到的参数组合,所述参数组合包括核函数参数和惩罚因子,将所述训练集数据作为所述训练模型的输入;步骤三:运用仿生搜索算法对支持向量机SVM的参数组合进行寻优,在全局范围内获得最优解;步骤四:根据获取的最优参数,对模型进行优化,将所述测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。

【技术特征摘要】
1.一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程包括以下步骤:步骤一:对中草药样本数据集进行特征提取的预处理,特征提取后的中草药样本数据集分成两组,75%数据集作为训练集数据,25%数据集作为测试集数据;步骤二:构建支持向量机SVM训练模型,确定其涉及到的参数组合,所述参数组合包括核函数参数和惩罚因子,将所述训练集数据作为所述训练模型的输入;步骤三:运用仿生搜索算法对支持向量机SVM的参数组合进行寻优,在全局范围内获得最优解;步骤四:根据获取的最优参数,对模型进行优化,将所述测试集数据作为优化模型的输入,进行数据测试,得到中草药种类及不同产地的识别分类。2.根据权利1所述的一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程步骤为:步骤一中将采集并测量得到的一个中草药样本数据信息矩阵Fs向量化,选取其中达到稳态响应值的测量值,组成训练样本矩其中r代表训练样本矩阵的行数,由选取的样本类,样本个数及稳态时间值个数决定,j代表训练样本类别个数j∈[1,3],i代表第j类训练样本个数i∈[1,ni]。3.根据权利1所述的一种中草药种类及不同产地的识别分类方法,其特征在于,所述方法的实现过程步骤为:步骤二中采用径向基函数作为支持向量机的核函数,其形式为:

【专利技术属性】
技术研发人员:李会骆德汉孙运龙彭珂
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1