基于PCA_LDA分析的多谱图特征融合识别方法技术

技术编号:8907378 阅读:258 留言:0更新日期:2013-07-11 05:04
本发明专利技术公开了一种基于PCA_LDA分析的多谱图特征融合识别方法,包括:利用PCA_LDA方法提取所有样本的谱图特征,并将提取得所有样本的多谱图特征融合为多谱融合特征矩阵;建立多谱融合SVM分类器;利用多谱融合SVM分类器样本进行识别;本发明专利技术所设计的基于PCA_LDA分析的多谱图特征融合识别方法能够快速的对复杂混合物整体特征进行准确分析识别。

【技术实现步骤摘要】
基于PCA_LDA分析的多谱图特征融合识别方法
本专利技术涉及一种基于PCA_LDA分析的多谱图特征融合识别方法,特别是一种快速的复杂混合物整体特征的谱图分析方法。
技术介绍
模式识别结合光谱、色谱、离子迁移谱、质谱、核磁共振等分析技术广泛应用于各类食品质量控制上。拉曼光谱是一种散射光谱。拉曼光谱分析法是基于印度科学家C.V.拉曼所发现的拉曼散射效应,对与入射光频率不同的散射光谱进行分析以得到分子振动、转动方面信息,并应用于分子结构研究的一种分析方法。拉曼光谱的主要特点是快速、简单、样品无需前处理、信号重复性好。此外由于水的拉曼散射很微弱,因此拉曼光谱可以进行水溶液中的物质测量检测,大大扩展了进行研究检测范围。离子迁移谱是在20世纪70年代初出现的一种新的气相分离和检测技术。它以离子漂移时间的差别来进行离子的分离定性,借助类似于色谱保留时间的概念,起初被称为等离子体色谱。离子迁移谱是一种高效的分离分析技术,已广泛应用在石油化工、环境分析、食品分析等领域。质谱是通过对被测样品离子的质荷比的测定来进行分析的一种分析方法。由于质谱分析具有灵敏度高,样品用量少,分析速度快,分离和鉴定同时进行等优点,因此,质谱技术也广泛的应用于化学化工、环境分析,医药分析等领域。随着假冒伪劣技术的快速更迭,目前我国公共产品特别是食品质量安全中的各类风险与忧患日益增加,对产品质量安全信息的科学、快速获取技术与设备的需求日益迫切。近年来,在国际范围内特别是国内发生的一系列食品安全恶性事件,表明采取以某一项或者某几项特征值来判断产品质量的弊端也越来越显著,采用整体信息对产品进行定性定量判定正在成为研究的焦点。对于复杂的化合物体系,单张谱图难以全面地反映出产品的化学组成特征,需要联用多谱图信息,即将反映产品不同化学信息的各种谱图信息融合在一起,综合表征产品的化学组成特性,使得各种信息进行有效地互补,增强数据的可信任度,提高预测精度、可靠性和鲁棒性,这对食品的整体信息判定具有重要的研究意义。尽管多谱图信息融合的研究取得了一定的成果,在色-质联用、气-红联用等分析仪器中有一些简单的数据融合,但是对物质整体定性/定量判定方面依赖于质谱、红外光谱。没有在联用系统内部实现谱图信息融合,更没有实现不同联用系统之间的信息融合。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术的不足,提供一种能够快速的对复杂混合物整体特征进行准确分析识别的基于PCA_LDA分析的多谱图特征融合识别方法。本专利技术具体采用以下技术方案解决上述技术问题:本专利技术设计了一种基于PCA_LDA分析的多谱图特征融合识别方法,包括如下具体步骤:步骤(1):采集n个样本,设定n个样本属于c种类别,对每一个样本选取m个不同谱图,利用PCA_LDA方法提取所有样本的谱图特征,并将提取得所有样本的谱图特征融合为多谱融合特征矩阵;步骤(2):利用步骤(1)中的多谱融合特征矩阵建立多谱融合SVM分类器;步骤(3):利用步骤(2)中建立的多谱融合SVM分类器对步骤(1)中采集的样本进行识别。作为本专利技术的一种优化方法:所述步骤(1)包括如下具体处理:步骤(11):标记第i个样本的训练样本集数据为第i个样本的m维数据集向量为则所有样本的n×m原始数据矩阵为其中,i=1,2,3…n,li定义为的类别标签;步骤(12):利用步骤(11)中的原始数据矩阵X和如下公式计算类内离差矩阵Sw:其中,ng表示第g类的样本个数,定义为第g类的样本的均值向量,g=1,2,3…c,定义为第g类样本中的第p个样本的向量,T定义为矩阵转置,p=1,2,3…ng;步骤(13):利用步骤(11)中的原始数据矩阵X和如下公式计算类间离差矩阵Sb:其中,定义为所有样本的均值向量,定义为第g类样本的均值向量;步骤(14),利用步骤(12)和步骤(13)中的Sw、Sb和公式计算特征值λ1,λ2,…,λc-1及特征值所对应的特征向量并得到投影矩阵步骤(15):对步骤(14)中的投影矩阵WLDA进行PCA降维处理,得到PCA投影矩阵WPCA,再将PCA投影矩阵WPCA投影到q维空间中,得到q维空间特征矩阵XPCA,其中,XPCA=X·WPCA;步骤(16):将WLDA、WPCA和XPCA利用如下公式完成最终的特征提取:则m个不同谱图的投影后特征矩阵分别为其中,定义为投影后的特征矩阵;步骤(17):利用公式将第i个样本的不同图谱投影后特征矩阵进行融合处理得到第i个样本的多谱融合特征矢量,并对所有的样本进行同样的融合处理,得到所有样本的多谱融合特征矩阵其中,定义投影后的特征矩阵矢量,为θf定义为第f种图谱的组合系数,f=1,2,3…m。作为本专利技术的一种优化方法:所述步骤(2)包括如下具体处理:步骤(21):将步骤(17)中得到的多谱融合特征矩阵代入如下函数:求得0]]>时的支持向量其中,z=1,2,3…n,j=1,2,3…n,定义为第z个样本多谱融合特征矢量的最优化函数;步骤(22):利用步骤(21)得到的支持向量和如下公式求得第z个样本多谱融合特征矢量的偏执量b*z:步骤(23):步骤(22)得到的偏执量b*z和支持向量代入如下函数中:其中,k(,)定义为支持向量机的核运算,即为本文档来自技高网
...
基于PCA_LDA分析的多谱图特征融合识别方法

【技术保护点】
一种基于PCA_LDA分析的多谱图特征融合识别方法,其特征在于,包括如下具体步骤:步骤(1):采集n个样本,设定n个样本属于c种类别,对每一个样本选取m个不同谱图,利用PCA_LDA方法提取所有样本的谱图特征,并将提取得所有样本的谱图特征融合为多谱融合特征矩阵;步骤(2):利用步骤(1)中的多谱融合特征矩阵建立多谱融合SVM分类器;步骤(3):利用步骤(2)中建立的多谱融合SVM分类器对步骤(1)中采集的样本进行识别。

【技术特征摘要】
1.一种基于PCA_LDA分析的多谱图特征融合识别方法,其特征在于,包括如下具体步骤:步骤(1):采集n个样本,设定n个样本属于c种类别,对每一个样本选取m个不同谱图,利用PCA_LDA方法提取所有样本的谱图特征,并将提取得所有样本的谱图特征融合为多谱融合特征矩阵;所述步骤(1)包括如下具体处理:步骤(11):标记第i个样本的训练样本集数据为第i个样本的m维数据集向量为则所有样本的n×m原始数据矩阵为其中,i=1,2,3…n,li定义为的类别标签;步骤(12):利用步骤(11)中的原始数据矩阵X和如下公式计算类内离差矩阵Sw:其中,ng表示第g类的样本个数,定义为第g类的样本的均值向量,g=1,2,3…c,定义为第g类样本中的第p个样本的向量,T定义为矩阵转置,p=1,2,3…ng;步骤(13):利用步骤(11)中的原始数据矩阵X和如下公式计算类间离差矩阵Sb:其中,定义为所有样本的均值向量,定义为第g类的样本的均值向量;步骤(14):利用步骤(12)和步骤(13)中的Sw、Sb和公式计算特征值λ1,λ2,…,λc-1及特征值所对应的特征向量并得到投影矩阵步骤(15):对步骤(14)中的投影矩阵WLDA进行PCA降维处理,得到PCA投影矩阵WPCA,再将PCA投影矩阵WPCA投影到q维空间中,...

【专利技术属性】
技术研发人员:王海燕刘军王国祥姜九英
申请(专利权)人:江苏易谱恒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1