当前位置: 首页 > 专利查询>江苏大学专利>正文

基于模拟退火-遗传算法近红外光谱特征子区间选择方法技术

技术编号:3943708 阅读:247 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于模拟退火-遗传算法近红外光谱特征子区间选择方法,先对近红外光谱进行预处理,再对预处理后的近红外光谱动态划分子区间,将模拟退火算法中的Metropolis准则引入遗传算法中的基因交换和基因选择算子,使用模拟退火-遗传算法选择最优特征子区间,最后判断最佳子区间划分方式和最优特征子区间组合,对入选的最优特征子区间建立PLS模型。本发明专利技术通过改进后的变异和交换算子产生高质量的子代个体,既提高了群体总体的适应度水平,又为种群进化提供了足够动力;有效避免了建模过程中依靠经验人工指定光谱子区间总数带来的不足,可快速得到精度高、预测能力强的光谱模型。

【技术实现步骤摘要】

本专利技术涉及一种对农产品、食品品质进行分析的近红外光谱特征子区间的选择方法,特指一种基于模拟退火-遗传算法的近红外光谱特征子区间的选择方法。
技术介绍
近红外光谱因分析速度快、效率高等特点越来越广泛地运用到农产品、食品品质 分析中,但近红外光谱也存在一定的不足,如背景复杂、信息强度低,谱峰重叠等,难以用常 规的谱图解析方法解析,因此,如何有效地从大量近红外光谱数据中提取特征信息成为本 领域研究的重点。样品在近红外光谱的某个或者某几个波段发生特征吸收,决定了高信息量波数点 邻近的波数点具有较高的信息量,即近红外光谱数据具有一定的连续相关性。根据近红外 光谱数据的这一特点,兼顾减少波长选择算法计算量,提高算法效率等要求,通常将近红外 全光谱分成若干个子区间,以区间为单位进行波长选择。经典光谱区间选择算法有间隔偏 最小二乘法,该算法将全光谱分成若干个子区间,分别计算各个子区间的交互验证均方根 误差值RMSECV(Root Mean Square of Cross Validation),将交换验证均方根误差最小的 一个区间作为建模区间。间隔偏最小二乘算法的衍生算法有联合区间偏最小二乘法、向前/ 向后区间偏最小二乘算法、移动窗口偏最小二乘法等,同经典区间偏最小二乘算法相比,衍 生算法不仅考察单一区间,还有几个区间的联合。这些算法虽然能提取光谱的特征信息,但 划分子区间的过程具有一定的主观性。遗传算法是20世纪70年代兴起的一门新兴学科,它基于对生物界自然选择和自 然遗传机制的模拟来解决实际问题,是一种具有高度的并行、随机和自适应性的搜索算法。 近年来有学者将遗传算法同经典间隔偏最小二乘算法相结合,用于选择近红外光谱的特征 子区间,模拟自然界遗传变异等自然进化过程,求解特征子区间的最优组合,但仍然存在一 些不足,如划分子区间往往依靠经验进行,具有一定的主观性;遗传算法容易发生过早收敛 而陷入局部最优解,不能确保得到全局最优近似解等。模拟退火算法是基于Mote Carlo迭代求解策略的一种随机寻优算法,其出发点是 基于物理退火过程与组合优化之间的相似性。模拟退火算法由一较高初温开始,利用具有 概率突跳性的Metropolis抽样策略在待选解组合中进行随机搜索,伴随温度不断下降重 复抽样过程,最终得到问题的全局最优解,适用解决大规模组合优化问题。
技术实现思路
为克服现有技术中近红外光谱划分子区间具有一定主观性的不足,确保得到全局 最优近似解,本专利技术提出了一种基于模拟退火-遗传算法近红外光谱特征子区间选择方 法,将模拟退火算法中的核心Metropolis接受准则引入遗传算法,在保证遗传算法执行效 率的基础上防止过早的陷入局部最优解,从而得到近红外光谱特征子区间的最优组合。本专利技术采用的技术方案是先对近红外光谱进行预处理,再对预处理后的近红外光谱动态划分子区间,将模拟退火算法中的Metropolis准则引入遗传算法中的基因交换 和基因选择算子,使用模拟退火-遗传算法选择最优特征子区间,最后判断最佳子区间划 分方式和最优特征子区间组合,对入选的最优特征子区间建立PLS模型。本专利技术采用上述技术方案后得到以下效果1、将模拟退火算法中的Metropolis准则引入交换算子和变异算子,通过改进后 的变异和交换算子产生高质量的子代个体,既提高了群体总体的适应度水平,又为种群进 化提供了足够动力。2、Metr0p0lis准则的引入有效地解决了传统遗传算法过早收敛、陷入局部最优解 的不足;动态划分光谱子区间,有效地避免了建模过程中依靠经验人工指定光谱子区间总 数带来的不足。3、基于模拟退火-遗传算法的近红外光谱特征子区间选择方法为快速得到精度 高、预测能力强的光谱模型打下了坚实的基础。以下结合附图和具体实施方式对本专利技术作进一步详细说明。附图说明图1是本专利技术流程图;图2是Metropolis接受准则示意图;图3是引入Metropolis准则的交换算子示意图;图4是引入Metropolis准则的变异算子示意图;图5是模拟退火_遗传算法特征子区间选择结果图;图6是模拟退火_遗传算法与传统遗传算法建模效果比较结果图;图7是标准正交变换预处理后的黄瓜叶叶黄素近红外光谱图。具体实施例方式本专利技术先对近红外光谱进行预处理,用适当的消噪方法处理农产品、食品原始近 红光谱后得到的光谱,消噪方法包括标准正交变化、多元散射校正、中心化、一阶/ 二阶导 数预处理方法等;同时光谱预处理过程还包括对校正集和预测集样本的划分。对预处理后 的近红外光谱动态划分子区间,划分子区间时,子区间数在一个范围内动态变化。算 法后续处理将在范围内选取最优特征子区间数,当光谱子区间数为k e 时,全 光谱等分为k个子区间,如果总波数点数除以k等于P,存在余数q,则前q个子区间中每个 子区间波数点个数为P+1,剩余子区间中每个子区间波数点个数为P。模拟退火算法中Metropolis准则是指模拟退火算法中用于判断新解、旧解重要 性的一种判断法则。Metropolis准则根据旧解、新解对应的目标函数值,判断旧解、新解中 哪个解是重要解,如果新解被认为是重要解,则用新解取代旧解进入下一次迭代;反之则维 持旧解不变。针对最优特征子区间问题,假设旧解X、新解y对应的目标函数值分别为f (χ) 和f (y),那么基于如下Metropolis准则判断旧解χ、新解y的重要性当f (y) > f(x)时,新解为重要解,否则判断下式凡=exp(f(x)-f(y)/t))>r 是否成立,其中Pt是新解转移概率,r由范围为0 1的均勻概率密度函数随机产生;如果上式成立,则认为新解y是重要解,否则认为旧解X是重要解。本专利技术将上述模拟退火算法中的Metropolis准则引入遗传算法中的基因交换和 基因选择算子,称为“模拟退火_遗传算法”,即在传统基因交换算子和基因变异算子时,父 辈染色体通过基因交换或者基因变异产生子代染色体,引入Metropolis准则判断父辈染 色体(对应旧解χ)和子代染色体(对应新解y)的重要性,如果子代染色体比父辈染色体 重要,则接受子代染色体,否则拒绝子代染色体。使用模拟退火-遗传算法选择光谱最优特征子区间,结合引入Metropo 1 i s准则的 基因交换、基因变异算子和传统遗传算法的其它算子,对划分子区间后的近红外光谱选择 最优特征子区间,智能判断最佳子区间划分方式和最优特征子区间组合,对入选的最优特 征子区间建立校正集和预测集的PLS模型,并计算校正集均方根误差、预测集均方根误差、 校正集相关系数、预测集相关系数等建模参数。本专利技术划分子区间以及选择最优特征子区间需要设置如下参数(1)最小子区间数Itl 指至少将全光谱划分为Itl个子区间。(2)最大子区间数If 指至多将全光谱划分为If个子区间。(3)目标函数f (χ)目标函数的作用是判断当前解χ的质量,一般情况下f (X)值 越高,代表当前解χ的质量越好。本专利技术模拟退火-遗传算法的目标是优选特征子区间,当 前被选入所有特征子区间被看成是当前解X,目标函数定义为f(x) = 1/(1+RMSECV),其中 RMSECV为选入的所有区间PLS模型对应的交互验证均方根误差值。(4)基因编码由于遗传算法不能直接处理本文档来自技高网
...

【技术保护点】
一种基于模拟退火-遗传算法近红外光谱特征子区间选择方法,其特征是:先对近红外光谱进行预处理,再对预处理后的近红外光谱动态划分子区间,将模拟退火算法中的Metropolis准则引入遗传算法中的基因交换和基因选择算子,使用模拟退火-遗传算法选择最优特征子区间,最后判断最佳子区间划分方式和最优特征子区间组合,对入选的最优特征子区间建立PLS模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:邹小波石吉勇赵杰文殷晓平陈正伟黄星奕蔡建荣陈全胜
申请(专利权)人:江苏大学
类型:发明
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1