当前位置: 首页 > 专利查询>温州大学专利>正文

一种基于光谱不同特征集的共识模型构建方法技术

技术编号:19851689 阅读:41 留言:0更新日期:2018-12-22 10:06
本发明专利技术属于光谱检测分析领域,具体是基于光谱不同特征集的共识模型构建方法,一般用于激光诱导击穿光谱及拉曼光谱的贝类重金属含量的快速定量检测。通过不同方法可以提取到不同的光谱特征集,与样本重金属浓度来建立多个单变量或多变量的线性或非线性回归模型。通过优化参数得到每一特征集的最优回归模型,作为成员模型。通过各成员模型的残差、成员模型之间误差的相关性来确定各个成员模型的权系数,来构建共识模型,从而使融合后的共识模型具有最小的预测误差。本发明专利技术可以充分利用不同的光谱信息和模型信息,使共识模型的预测结果更加稳定、可靠。

【技术实现步骤摘要】
一种基于光谱不同特征集的共识模型构建方法
本专利技术属于光谱检测分析领域,具体是指一种基于光谱不同特征集的共识模型构建方法,该模型可用于定量检测方法,可适用于激光诱导击穿光谱和拉曼光谱检测分析。
技术介绍
重金属污染是各种环境问题中比较突出的问题之一,主要指各种有害重金属或其化合物所造成的环境污染。城镇化、工业化进程的加快,使得大量有害重金属排入水体,导致水俣病(汞中毒)、骨痛病(镉中毒)等事件发生。重金属污染不仅毒害水产生物,还通过食物链浓缩进入人体,引起中毒反应。针对日益严峻的重金属污染问题,早2011年3月,我国出台了《重金属污染综合防治规划》,重金属污染防治实施方案在2016到2020年将逐步进入黄金期。在我国东南沿海地区,盛产各类水产品,其中贝类富含各种营养物质,及其鲜美口味,深受人们喜爱。我国贝类养殖产量居世界之首,在2016年达到1476万吨;贝类产品已经成为我国重要的出口产品,远销日本、韩国、欧美等国家和地区。贝类的滩涂养殖及非选择性的滤食习性,相比其他水产品有着更强的重金属富集能力,且具有隐蔽性、长期性、累积性等特性,这凸显了贝类在食品安全上的风险地位。为此,政府陆续出台了《农产品安全质量无公害水产品安全要求》(GB18406.4-2001)、《鲜、冻动物性水产品卫生标准》(GB2733-2005)、《无公害食品水产品中有毒有害物质限量》(NY5073-2006)等标准,严控贝类品质安全。因此,开展对贝类重金属污染信息的检测,不仅可以评估贝类的品质安全性,还完善贝类养殖监督管理制度。目前重金属的常规检测方法,主要包括传统的化学检测法(原子光谱法、质谱法、电化学法)和生物检测法(生物传感器法、酶联免疫吸附法)。这些方法检测灵敏度高,检测结果精确,但检测成本高、操作过程复杂、耗时费力、有损样本,且仅能抽样检测,无法实现大规模样品的信息获取。近年兴起的光谱分析技术,在食品安全领域得到了飞速的发展,如近红外光谱、红外光谱、拉曼光谱等,特别激光诱导击穿光谱(Laser-inducedbreakdownspectroscopy,LIBS),是一种基于物质表面被激光腐蚀激发出等离子体、发生能量跃迁从而被光谱仪器探测的一种直接分析技术,可以鉴别气体、液体、固体等多相物质的元素组成。鉴于LIBS的激发谱线对应着特定元素,可以用于样品的未知元素或组分的定性或半定量检测,如利用元素特征谱线,结合化学计量学数据分析技术来定量、定性检测水产品及土壤中的重金属。激光诱导击穿光谱作为一种有效的金属鉴别分析技术,依据光谱的脉冲峰位置可查阅标准原子库,可以鉴别检测物质的主要重金属成分。但是,由于待检测样本例如贝壳(例如泥蚶等)为一种有机的生命体,在其生长过程中,会富集其他类别重金属成为其微量元素,这势必会影响到LIBS光谱对泥蚶重金属浓度的定量检测精度。目前常用的数据建模方法为:优化建模方法(如线性、非线性的建模方法)、优选变量(即寻找富含信息的谱线)来提高光谱的重金属分类准确率或检测精度。但这类方法仅依据全单一数据信息或单个模型,仅能有限地改善模型精度,却忽略了其他数据信息或模型信息,如LIBS光谱、拉曼光谱的特征谱线峰面积、峰强度、峰强度比值等,均能为重金属的定量检测提供一定的信息。基于此,有必要对此进行综合改进。
技术实现思路
本专利技术的目的是为了克服现有技术存在的缺点和不足,而提供一种基于光谱不同特征集的共识模型构建方法。为实现上述目的,本专利技术的技术方案是包括有:步骤S1:根据所测物质的组分信息Y,分析其光谱中特征谱线所处区域X_region,并采用预处理方式对该区域的特征谱线进行滤波处理,提高特征谱线的信噪比;步骤S2:针对特征谱线的谱峰分布,在一个长度为x_windowsize的窗口内识别出Pi位置处的一个峰,提取该谱峰的参数,该参数包括有峰高Peak_int、半峰宽Peak_width和峰面积Peak_area、不同谱峰强度的比值Peak_ratio;步骤S3:该步骤用于构建成员模型,包括有3.1)对上述提取的谱峰各参数分别构建单变量或多变量回归模型fi,以交叉验证法优化模型fi;3.2)对光谱区域X_region构建全区间的多变量回归模型f0,以交叉验证法优化模型f0;3.3)计算成员模型的预测残差向量其中为第i个成员模型对第k个样本的预测值,yk为训练集的第k样本,成员模型的预测残差矩阵表示为E=[e0,e1,…ei,…en],(i=0,1,…i,…,n);3.4)计算第i个成员模型的预测残差向量的均方根误差为3.5)计算各成员模型的预测残差向量间的相关性步骤S4:该步骤用于通过成员模型来构建共识模型,包括有:4.1)各成员模型经加权得到共识模型且其中wi为各成员模型的权系数;4.2)当共识模型的均方误差最小时,使得共识模型的预测误差最小;4.3)在约束条件为下,通过非线性优化方法计算wi,根据各成员模型fi(xi),构造共识模型F(x)。进一步设置是所述的步骤S1中的滤波为:对截取的光谱区域X_region进行平滑预处理,以Savitzky-Golay多项式平滑滤除噪声,平滑方式如下:其中,yi为当前平滑点,令n=2m+1,n为平滑窗口的长度,cj为各点系数。本专利技术的共识模型F(x)是多个成员模型的加权组合,成员模型fi(xi)就是基于光谱及谱峰特征的回归模型,这些回归模型可以是单变量或多变量的线性、非线性回归模型。第i个成员模型的具体形式由第i个光谱特征集xi采用方法fi构建成的回归模型fi(xi)。与现有技术相比,本专利技术的有益效果是:可以更好地挖掘不同特征集构建模型来提供预测精度、充分利用不用模型的预测信息、融合成员模型之间的冗余信息,使共识模型同时考虑了各特征集的模型信息、各个成员模型的误差以及误差之间的相关性,能保证共识模型具有最小的误差(即MSE)。本专利技术拟结合不同特征集的成员模型来构建共识模型,用于贝类重金属的定量检测。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本专利技术的范畴。图1本专利技术的共识模型构建方法的流程图;图2本专利技术的原理说明图;图3本实施例受铜重金属污染的泥蚶LIBS平均光谱图;图4本实施例共识模型对铜重金属浓度的预测散点图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述。如图1-2所示,构建共识模型,包括以下步骤:步骤S1:光谱预处理及特征参数提取,包括有:1.1)根据所测物质的组分信息Y,分析其特征谱线所处区域X_region;1.2)滤波,对截取的光谱区域X_region进行平滑预处理,以Savitzky-Golay多项式平滑滤除噪声,平滑方式如下:其中,yi为当前平滑点,令n=2m+1,n为平滑窗口的长度,cj为各点系数。步骤S2:针对特征谱线的谱峰分布,在一个长度为x_windowsize的窗口内识别出Pi位置处的一个峰,提取该谱峰的参数,包括有峰高Peak_int、半峰宽Peak_width和峰面本文档来自技高网
...

【技术保护点】
1.一种基于光谱不同特征集的共识模型构建方法,其特征在于包括有:步骤S1:根据所测物质的组分信息Y,分析其光谱中特征谱线所处区域X_region,并采用预处理方式对该区域的特征谱线进行滤波处理,提高特征谱线的信噪比;步骤S2:针对特征谱线的谱峰分布,在一个长度为x_windowsize的窗口内识别出Pi位置处的一个峰,提取该谱峰的参数,包括有峰高Peak_int、半峰宽Peak_width、峰面积Peak_area,以及不同谱峰强度的比值Peak_ratio;步骤S3:该步骤用于构建成员模型,包括有3.1)对上述提取的谱峰各参数分别构建单变量或多变量回归模型fi,以交叉验证法优化模型fi;3.2)对光谱区域X_region构建全区间的多变量回归模型f0,以交叉验证法优化模型f0;3.3)计算成员模型的预测残差向量

【技术特征摘要】
1.一种基于光谱不同特征集的共识模型构建方法,其特征在于包括有:步骤S1:根据所测物质的组分信息Y,分析其光谱中特征谱线所处区域X_region,并采用预处理方式对该区域的特征谱线进行滤波处理,提高特征谱线的信噪比;步骤S2:针对特征谱线的谱峰分布,在一个长度为x_windowsize的窗口内识别出Pi位置处的一个峰,提取该谱峰的参数,包括有峰高Peak_int、半峰宽Peak_width、峰面积Peak_area,以及不同谱峰强度的比值Peak_ratio;步骤S3:该步骤用于构建成员模型,包括有3.1)对上述提取的谱峰各参数分别构建单变量或多变量回归模型fi,以交叉验证法优化模型fi;3.2)对光谱区域X_region构建全区间的多变量回归模型f0,以交叉验证法优化模型f0;3.3...

【专利技术属性】
技术研发人员:袁雷明何坤成陈孝敬陈熙李理敏户新宇朱德华施一剑
申请(专利权)人:温州大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1