System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于梯度的色谱峰识别方法及系统技术方案_技高网

一种基于梯度的色谱峰识别方法及系统技术方案

技术编号:40646202 阅读:6 留言:0更新日期:2024-03-13 21:26
本发明专利技术公开一种基于梯度的色谱峰识别方法及系统,方法包括以下步骤:对色谱监测信号的值进行平滑处理,用平滑处理所得值估算点t时刻的梯度,得到梯度数据;对梯度数据百分位计算,分别计算出0,1,2,…,99,100百分位的梯度值,计算0‑100百分位的梯度值二阶差分;获取所述梯度值二阶差分的阈值,根据所述阈值确定处于色谱峰区段内的数据,获取数据中峰爬升点与下降点的点集;设定容忍度参数ξ,结合所述阈值与每个监测点的梯度的关系,是否连续出现ξ+1个相同变化规律的梯度,得到峰形起止点;对峰形起止点之间的数据过滤噪声,确定有效色谱峰,提出通过梯度百分位来确定梯度阈值的方法;方法本质上依然基于梯度,对基线漂移的情况适应的比较好。

【技术实现步骤摘要】

本专利技术属于环保监测,具体涉及一种基于梯度的色谱峰识别方法及系统


技术介绍

1、挥发性有机物也称vocs(volatile organic compounds),在大气化学中起着非常重要的作用,是我国臭氧、光化学烟雾、二次有机气溶胶以及可入肺颗粒物pm2.5的重要前体物。vocs在大气中容易被氧化,且部分vocs具有致癌作用,对人体健康有极大危害。由于vocs成分的复杂性和危害性,并且在空气中极容易发生各种化学变化,已成为近些年环境保护工作研究的热点内容。

2、在环保监测中,通常采用色谱法对vocs进行检测分析。色谱法是一种多组分混合物的分离、分析的技术,通过对vocs混合物组分的分离和信号转换,得到电信号随着时间变化产生波形,即色谱曲线-时间函数关系式。通过对该数字信号进一步处理,如数字滤波、峰的判别和峰面积或峰值的计算等,可以得到该混合物中各组分化学成分、浓度等信息。

3、在色谱分析过程中,如何通过计算机对色谱曲线进行峰识别、标记和计算峰面积是一个具有挑战而且必然面对的问题。具体表现在:在复杂的色谱图谱中,可能存在多峰重叠或峰形不清晰的情况,此外,峰的形状与大小也会受到峰宽、信噪比等因素的影响,增加了峰识别的难度。对于识别出的峰,需要准确地标记其峰顶位置和宽度,以便进行后续的分析计算,然而由于色谱图谱中可能存在噪声与基线漂移等问题,峰的准确标记也是一个挑战。由于以上各种问题的存在,峰面积计算也比较难以实现。在现有的色谱峰识别算法当中以阈值法、波峰波谷法、高斯拟合法、小波变换法、导数法为最常用,各方法都有其优缺点,阈值法简单计算速度快,但缺点是对于峰的形状和信噪比要求较高,对基线漂移敏感。波峰波谷法对峰形和信噪比要求较低,对基线漂移不敏感,但对于多峰重叠和峰形不规则的情况处理能力较弱。高斯拟合法对于对称的高斯峰拟合效果较好,但对非高斯峰或峰形变化较大的情况拟合效果不佳。小波变换法对于峰形变化较大的情况有较好的适应性,但计算复杂度高,对参数的选择较为敏感。导数法对较窄且对称的峰有较好的识别效果,但对峰形不规则或背景噪声较大的情况处理能力有限。


技术实现思路

1、为了解决现有技术中存在的问题,本专利技术提供一种基于梯度的色谱峰识别方法,通过对挥发性有机物色谱数据滤波处理,算法自适应调整合适的梯度阈值,识别峰出现的位置,实现了对挥发性有机物各组分的识别和组分浓度的计算。

2、为了实现上述目的,本专利技术采用的技术方案是:一种基于梯度的色谱峰识别方法,包括以下步骤:

3、获取色谱监测信号的值,对所述色谱监测信号的值进行平滑处理,利用平滑处理所得值估算点t时刻的梯度dt,进而得到一组梯度数据;

4、对所述一组梯度数据,通过百分位计算,分别计算出0,1,2,…,99,100百分位的梯度值dp,计算0-100百分位的梯度值二阶差分;

5、获取所述梯度值二阶差分的阈值,根据所述阈值确定处于色谱峰区段内的数据,进一步获取数据中峰爬升点与下降点的点集;

6、设定容忍度参数ξ,结合所述阈值与每个监测点的梯度的关系,是否连续出现ξ+1个相同变化规律的梯度,判定得到峰形起止点;

7、对峰形起止点之间的数据过滤噪声,确定有效色谱峰。

8、进一步的,对所述色谱监测信号的值进行平滑处理时采用均值平滑处理,t时刻的梯度dt计算如下:

9、

10、

11、其中,δ与γ均表示t时刻前后微小时间间隔,vi是以t时刻为中心,前后共w个监测数据点的的第i个值,w代表平滑窗口大小。

12、进一步的,0,1,2,…,99,100百分位的梯度值dp为:

13、dp=percentile(d0,d1,d2,...,dt,...dn)  (4)

14、其中p表示0,1,2,...,99,100;对0-100百分位的梯度值进行二阶差分,差分原则是后一个百分位值减去前面的百分位值:

15、dif1p=dp+1-dp  (5)

16、dif2p=dif1p+1-dif1p  (6)。

17、进一步的,获取所述梯度值二阶差分的阈值,根据所述阈值确定处于色谱峰区段内的数据,进一步获取数据中峰爬升点与下降点的点集包括:从百分位中端向两端分别确定峰的开始与结束点的梯度阈值,其计算公式如下:

18、i=max{argp[(|dif22|...|dif2p|...|dif250|)>σ]}  (7)

19、endthreshold=di  (8)

20、j=min{argp[(|dif251|...|dif2p|...|dif2100|)>σ]}  (9)

21、startthreshold=dj+50  (10)

22、其中j,i分别表示开始与结束梯度阈值对应的数组下标,argp表示取满足条件表达式的所有百分位下标,在这里指的是满足|dif2p|>0的所有的p的集合,得到数据中所有的峰爬升点与下降点的点集,对梯度序列添加对应阈值过滤:

23、tsr=argt[(d0,dt…dt)>startthreshold]  (11)

24、tsd=argt[(d0,dt…dt)<endthreshold]  (12)

25、tsr,tsd分别对应爬升与下降出现的一系列时间值。

26、进一步的,设定容忍度参数ξ,结合所述阈值与每个监测点的梯度的关系,是否连续出现ξ+1个相同变化规律的梯度,判定得到峰形起止点时,首先从爬升时间值序列中依次选起始点,然后判定后续每个监测时间点的梯度,如果梯度超过阈值,则表示峰爬升还在继续,如果低于阈值则表示处于波动或下降阶段,根据容忍度参数ξ继续判断后续时间点梯度,如果连续出现ξ+1个不超过爬升阈值的梯度,则判定最后一个梯度是否低于下降阈值,如果低于阈值就表示峰形进入到下降阶段,然后继续判断后续时间点梯度,当出现连续ξ+1个高于下降阈值的梯度,则说明该峰结束。

27、进一步的,对峰形起止点之间的数据过滤噪声,确定有效色谱峰包括:

28、去除无效数据、峰形不规整的数据以及噪音超过设定值的数据,保留有效数据,对所述有效数据进行标注;

29、将标注的有效数据划分为训练集和验证集,训练集用于调整算法超参数,验证集用于识别算法性能;

30、为每个超参数指定可能的取值,结合训练集采用随机搜索策略在超参数空间进行超参数组合搜索,用验证集验证超参数组合对应算法的识别性能,选出识别率较高的多组超参数;基于所述多组超参数,采用网格搜索进一步确定最优超参数组合。

31、进一步的,所述超参数包括对梯度百分位进行均值平滑处理的窗口大小、百分位平均划分时的数量、梯度百分位二阶差分的阈值、忍度参数ξ以及过滤可能存在的小峰的附加参数,附加参数表示峰爬升或下降阶段的最小监测点数量。

32、基于同样的专利技术构思,本本文档来自技高网...

【技术保护点】

1.一种基于梯度的色谱峰识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,对所述色谱监测信号的值进行平滑处理时采用均值平滑处理,t时刻的梯度Dt计算如下:

3.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,0,1,2,…,99,100百分位的梯度值Dp为:

4.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,获取所述梯度值二阶差分的阈值,根据所述阈值确定处于色谱峰区段内的数据,进一步获取数据中峰爬升点与下降点的点集包括:从百分位中端向两端分别确定峰的开始与结束点的梯度阈值,其计算公式如下:

5.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,设定容忍度参数ξ,结合所述阈值与每个监测点的梯度的关系,是否连续出现ξ+1个相同变化规律的梯度,判定得到峰形起止点时,首先从爬升时间值序列中依次选起始点,然后判定后续每个监测时间点的梯度,如果梯度超过阈值,则表示峰爬升还在继续,如果低于阈值则表示处于波动或下降阶段,根据容忍度参数ξ继续判断后续时间点梯度,如果连续出现ξ+1个不超过爬升阈值的梯度,则判定最后一个梯度是否低于下降阈值,如果低于阈值就表示峰形进入到下降阶段,然后继续判断后续时间点梯度,当出现连续ξ+1个高于下降阈值的梯度,则说明该峰结束。

6.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,对峰形起止点之间的数据过滤噪声,确定有效色谱峰包括:

7.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,所述超参数包括对梯度百分位进行均值平滑处理的窗口大小、百分位平均划分时的数量、梯度百分位二阶差分的阈值、忍度参数ξ以及过滤可能存在的小峰的附加参数,附加参数表示峰爬升或下降阶段的最小监测点数量。

8.一种基于梯度的色谱峰识别系统,其特征在于,包括数据获取模块、差分计算模块、区段数据获取模块、峰形起止点获取模块以及有效色谱峰确定模块:

9.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或者全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现权利要求1-7任一项所述的基于梯度的色谱峰识别方法。

10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现权利要求1-7任一项所述的基于梯度的色谱峰识别方法。

...

【技术特征摘要】

1.一种基于梯度的色谱峰识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,对所述色谱监测信号的值进行平滑处理时采用均值平滑处理,t时刻的梯度dt计算如下:

3.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,0,1,2,…,99,100百分位的梯度值dp为:

4.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,获取所述梯度值二阶差分的阈值,根据所述阈值确定处于色谱峰区段内的数据,进一步获取数据中峰爬升点与下降点的点集包括:从百分位中端向两端分别确定峰的开始与结束点的梯度阈值,其计算公式如下:

5.根据权利要求1所述的基于梯度的色谱峰识别方法,其特征在于,设定容忍度参数ξ,结合所述阈值与每个监测点的梯度的关系,是否连续出现ξ+1个相同变化规律的梯度,判定得到峰形起止点时,首先从爬升时间值序列中依次选起始点,然后判定后续每个监测时间点的梯度,如果梯度超过阈值,则表示峰爬升还在继续,如果低于阈值则表示处于波动或下降阶段,根据容忍度参数ξ继续判断后续时间点梯度,如果连续出现ξ+1个不超过爬升阈值的梯度,则判定最后一个梯度是否低于下降阈值,如果低于阈值就表示峰形...

【专利技术属性】
技术研发人员:李宁周李斌高涛
申请(专利权)人:西安鼎研科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1