当前位置: 首页 > 专利查询>中北大学专利>正文

基于离散多重宇宙优化算法的红外光谱波长选择方法技术

技术编号:13078533 阅读:46 留言:0更新日期:2016-03-30 12:36
本发明专利技术涉及红外光谱波长选择技术领域,更具体而言,涉及一种基于离散多重宇宙优化算法的红外光谱波长选择方法;本发明专利技术提出一种离散型的多重宇宙优化算法,并将其应用于红外光谱的波长选择领域;该方法将红外光谱波长选择问题映射为离散变量的优化问题,即先将整个光谱范围划分成若干个子区间,然后用一串仅含有“1”或“0”的二进制编码表示对应子区间的选择与否,接着对现有的多重宇宙优化算法进行离散化处理,最后进行迭代优化计算,从而筛选出最佳的特征波长组合;本发明专利技术主要应用在红外光谱波长选择方面。

【技术实现步骤摘要】

本专利技术设及红外光谱波长选择
,更具体而言,设及一种基于离散多重宇 宙优化算法的红外光谱波长选择方法。
技术介绍
红外光谱分析是一种新兴的分析技术,由于它具有快速、无损和无污染等优点,在 农业、化工和环境监测等领域有着广泛的应用。但是,红外光谱通常具有波长点多、吸收峰 重叠、波长点之间存在严重的共线性关系等特点,给后续的定性与定量分析造成困难。因 此,研究波长选择方法,对于简化模型、提高模型的预测能力和鲁棒性具有重要的实际意 义。 2015年2月,SeyedaliMirjalili等人受多重宇宙理论启发,提出了多重宇宙优化 (Multi-verseOptimizer,MV0)算法并发表在化uralComput&A卵lie杂志上。该算法引入 多重宇宙理论中的白桐、黑桐和虫桐等概念,实现传统群优化算法捜索过程中的全局探测 (6邱1〇阿1:;1)和局部捜索(6邱1〇;^曰1:;1)。在^0算法中,一方面利用白桐和黑桐两个概 念来实现在整个解空间中的探测;另一方面利用虫桐的概念来实现解空间中的局部捜索。 假设解空间中的每个潜在可行解为一个宇宙,解空间中的每个变量对应宇宙中的一个星 体。另外,假设每个潜在可行解(宇宙)存在一个膨胀速度,该膨胀速度与潜在可行解对应的 适应度函数值呈正比。在MV0算法的优化过程中,各个宇宙应该遵循W下规则: (1)宇宙的膨胀速度越大,其含有白桐的概率越高;[000引(2)宇宙的膨胀速度越大,其含有黑桐的概率越低; (3)膨胀速度大的宇宙趋向于通过白桐向外发送星体; (4)膨胀速度小的宇宙趋向于通过黑桐吸收外面更多的星体; (5)无论膨胀速度的大小,所有宇宙均有可能通过虫桐产生朝向最优宇宙的随机 移动。 然而,该算法仅适用于解决连续变量的优化问题,不适用于解决离散变量的优化 问题。因此,该算法无法直接应用于红外光谱的波长选择领域。为此,本专利提出一种离散 多重宇宙优化(DiscreteMV0,DMV0)算法,并将其应用于解决红外光谱的波长选择问题。
技术实现思路
针对现有的多重宇宙优化算法不适用于解决离散变量的优化问题,本专利技术提出一 种离散型的多重宇宙优化算法,并将其应用于红外光谱的波长选择领域。该方法首先利用 数学语言将红外光谱的波长选择问题描述为一个多变量的离散优化问题,即用"Γ或"0" 分别表示对应的波长是否被选中;其次,利用多重宇宙优化算法进行捜索求解,与现有的连 续型多重宇宙优化算法不同的是,需要在迭代过程中对新产生的个体(潜在可行解)进行离 散化处理。 为了解决上述技术问题,本专利技术所采用的技术方案为: 假设有N个样品,利用光谱仪扫描出的红外光谱信号为,对应的待分析组 分含量为Ye阪WX1。其中,P为红外光谱的波长点数,一般情况下N< <p。由化学计量学原理可得,待分析组分的含量预测模型可w表示为 Y=Xb+e(1)[001引其中,bGIT4为待拟合的回归系数;εe必W为噪声误差。将红外光谱的特征选择问题映射为一个目标函数的优化问题,具体的步骤如下:(1)将整个数据集划分为两部分:训练集和验证集。训练集用于创建回归模型;验 证集用于构建离散多重宇宙优化(DMV0)算法的适应度函数。(2)将整个光谱范围划分为若干个子区间,整个光谱范围用一串二进制码表示,对 应子区间的选择与否用"Γ与"0"表示。(3)随机产生一定规模的初始化种群,针对每个个体,先将其中编码为"Γ对应的 子区间光谱提取出来,并利用训练集创建回归模型;接着计算验证集的预测结果并选取相 关的评价指标作为该个体对应的适应度函数值。 (4)利用多重宇宙优化(MV0)算法进行迭代优化,W产生新的种群。 (5)在每次迭代过程中,需要对新产生的个体进行离散化处理。 (6)计算新产生的种群中每个个体的适应度函数值,并对相关的参数值进行更新。(7)判断是否满足迭代停止条件,若满足,则退出,输出最优值;否则,返回步骤 (4)。上述步骤(1)中所述的回归模型可W采用线性方法(多元逐步回归、PLS等),也可 W采用非线性方法(神经网络、支持向量机、极限学习机等)建立。上述步骤(2)中所述的子区间采用均匀或非均匀划分方式均可W。 上述步骤(3)中所述的适应度函数可W通过验证集的均方根误差(RootMean Squaredlirror,RMSE)、决定系数R2或其他评价指标构建。 上述步骤(4)中所述的MV0算法迭代优化过程主要涵盖W下两个阶段:全局探测 (exploration)和局部捜索(exploitation)。详细的描述如下:(1)全局探测(exploration)阶段。在该阶段,针对每个宇宙个体,将其作为黑桐; 同时,利用轮盘赌方法随机产生一个宇宙个体作为白桐。在黑桐和白桐间建立时空管道,并 进行星体的交换。假设初始种群为: 其中,d为潜在可行解中变量的个数;η为宇宙(潜在可行解)的个数。轮盘赌方法的选择规则如下: 其中,χ/表示第i个宇宙的第j个变量;Ui表示第i个宇宙;ΝΙ化i)表示归一化后的 第i个宇宙的膨胀速度;rl为范围内的一个随机数;冶表示第k个宇宙(即轮盘赌方法 选中的宇宙)的第j个变量。 (2)局部捜索(exploitation)阶段。为了保证宇宙的多样性,在该阶段假定每个宇 宙中均含有虫桐,即可W随机地在宇宙间传输星体,而不受膨胀速度大小的影响。为了提升 所有宇宙的平均膨胀速度,假定虫桐的时空管道仅建立在宇宙和最优宇宙之间,具体的公 式如下所示: 其中,Xj表示截止目前时刻寻找到的最优宇宙的第j个变量;TDR和WEP是两个系 数;Ibj表示第j个变量的下界;ubj表示第j个变量的上界;婷表示第i个宇宙的第j个变量; r2,r3和r4为范围内的随机数。WEP表征了宇宙中存在虫桐的可能性(概率)大小,随着 时间的推进,WEP需要逐渐增加,W提升局部捜索的重要性;TDR为宇宙中的星体通过虫桐传 输到最优宇宙的距离系数,与WEP相反,TDR需要随着时间的推进逐渐减小,W保证在最优宇 宙周围的局部捜索能力。具体的公式如下[003引其中,min为WEP的最小值;max为WEP的最大值;1为当前的迭代次数;L为最大迭代 次数。 其中,P表征了进入局部捜索阶段的快慢,P越大,表示越快进入局部捜索阶段。 上述步骤(5)中所述的离散化处理可W采用Sigmoid型、V型或其他类型的传递函 数。 上述步骤(7)中所述的迭代停止条件可W为最大迭代次数、相邻两次迭代的适应 度函数值误差容限或其他评价指标。 与现有技术相比本专利技术所具有的有益效果为: 基于现有的多重宇宙优化算法,本专利技术提出了离散多重宇宙优化算法,W适用于 离散型变量的优化问题。该方法为红外光谱的波长选择问题提供了一种新的途径和理论框 架,可W广泛应用于固相、液相和气相的红外光谱波长选择领域中。【附图说明】[004引下面通过附图对本专利技术的【具体实施方式】作进一步详细的说明。 图1为本专利技术的系统框图; 图2为60个汽油样品的近红外光谱图; 图3为虫桐存在概率(WEP)的传输距当前第1页1 2 本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/52/CN105445215.html" title="基于离散多重宇宙优化算法的红外光谱波长选择方法原文来自X技术">基于离散多重宇宙优化算法的红外光谱波长选择方法</a>

【技术保护点】
基于离散多重宇宙优化算法的红外光谱波长选择方法,其特征在于,按照以下步骤进行:步骤一、将整个数据集划分为两部分:训练集和验证集;所述训练集用于创建回归模型,所述验证集用于构建离散多重宇宙优化算法的适应度函数;步骤二、将整个光谱范围划分为若干个子区间,整个光谱范围用一串二进制码表示,对应子区间的选择与否用“1”与“0”表示;步骤三、随机产生一定规模的初始化种群,针对每个个体,先将其中编码为“1”对应的子区间光谱提取出来,并利用训练集创建回归模型;接着计算验证集的预测结果并选取相关的评价指标作为该个体对应的适应度函数值;步骤四、利用多重宇宙优化算法进行迭代优化以产生新的种群;步骤五、在每次迭代过程中,需要对新产生的个体进行离散化处理;步骤六、计算新产生的种群中每个个体的适应度函数值,并对相关的参数值进行更新;步骤七、判断是否满足迭代停止条件;若满足,则退出,输出最优值;否则,返回步骤四。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈媛媛张瑞景宁陈友华李晋华王志斌
申请(专利权)人:中北大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1