一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法技术

技术编号：14884420 阅读：108 留言：0更新日期：2017-03-25 00:03

本发明专利技术属于分析化学技术领域，具体为一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法。本发明专利技术首先采用蒙特卡罗技术选取一定数目的样品作为样品子集，然后采用LASSO技术从该样品子集中选择部分变量，作为样品变量子子集，重复多次，建立多个子模型，将这些模型的预测结果直接平均得到最终预测结果。该方法能有效地改善模型的预测能力，提高模型的预测精度，在预测精度和稳定性方面具有明显优势。本发明专利技术适用于石油、烟草、食品、中药等复杂样品定量分析。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于分析化学
，具体涉及一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法。
技术介绍
光谱分析技术以其简便、快速、绿色以及无损等优点在农业、食品、医药、环境等领域得到了广泛应用。然而，由于光谱吸收峰重叠现象严重，信号吸收较弱，背景干扰严重等问题，因此，在进行复杂样品定性、定量分析时需借助化学计量学手段。而建立一个稳定性好、预测精度高的模型一直是复杂样品定量分析的关键。传统建模方法采用单一模型在光谱和待测目标值之间建立定量分析模型，预测效果往往不尽如人意。因此，发展了集成建模技术，该技术通过将多个模型的结果进行融合得到最终预测结果。目前主要有基于样品及基于变量方法方向的集成建模方法，前者如boostingPLS（X.G.Shao,X.H.Bian,W.S.Cai,Animprovedboostingpartialleastsquaresmethodfornear-infraredspectroscopicquantitativeanalysis,Anal.Chim.Acta,2010,666,32-37）、baggingELM（卞希慧，李淑娟...
一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法

【技术保护点】
一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法，其特征在于，首先采用蒙特卡罗技术选取一定数目的样品作为样品子集，然后采用LASSO技术从该样品子集中选择部分变量，作为样品变量子子集，重复即迭代多次，建立多个子模型，将这些模型的预测结果直接作算术平均，即得到最终预测结果。

【技术特征摘要】
1.一种基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法，其特征在于，首先采用蒙特卡罗技术选取一定数目的样品作为样品子集，然后采用LASSO技术从该样品子集中选择部分变量，作为样品变量子子集，重复即迭代多次，建立多个子模型，将这些模型的预测结果直接作算术平均，即得到最终预测结果。2.根据权利要求1所述的基于蒙特卡罗及LASSO的双集成偏最小二乘建模方法，其特征在于，具体步骤为：（1）收集一定数目的复杂样品，测量其光谱，确定并测定目标分析物含量，采用一定的分组方式将数据集划分为训练集和预测集；这里，所述复杂样品是指多种组分的复杂混合物；（2）确定PLS模型的因子数LV：计算不同因子数下的交叉验证均方根误差（RMSECV），最小的RMSECV对应的因子数即为最佳因子数LV，RMSECV计算公式如下：其中，m为总样品数，为第i个样品的预测值，为第i个样品的真实值；（3）确定迭代次数T：迭代次数即模型个数从1变化到500，间隔为1，依次计算不同迭代次数下模型对训练集预测的预测均方根误差（RMS...

【专利技术属性】
技术研发人员：卞希慧，张彩霞，徐杨，谭小耀，陈宗蓬，王晨，
申请(专利权)人：天津工业大学，上海穗杉实业有限公司，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人