基于噪声估计的谱峰识别方法及系统技术方案

技术编号:33770893 阅读:26 留言:0更新日期:2022-06-12 14:23
本发明专利技术公开了一种基于噪声估计的谱峰识别方法,包括以下步骤:1)输入原始色谱数据R0,预处理后采用S

【技术实现步骤摘要】
基于噪声估计的谱峰识别方法及系统


[0001]本专利技术涉及数据处理领域,特别涉及一种基于噪声估计的谱峰识别方法及系统。

技术介绍

[0002]质谱分析作为高端定量检测分析,在检测的灵敏度、特异性、分析速度、多指标同时检测等方面有非常强的优势。发达国家大力发展医用质谱技术,质谱技术在医用实验室已有30年的应用历史,国外某些大型医用实验室拥有多达几十台质谱仪(如美国ARUP实验室),基于质谱的临床检测的项目已达400余项,涉及产前检查、新生儿筛查、滥用药物监测、代谢物检查(氨基酸、脂肪酸)、类固醇激素检测(内分泌)、维生素族检测以及微生物鉴定等领域。国内医用质谱正步入加速发展的快车道,目前已应用于新生儿遗传筛查、维生素D检测、药品检测等检测领域,市场空间预测百亿以上。医用质谱仪中,以液相色谱三重四极杆串联质谱联用仪(LC

MS/MS)应用最为广泛,开展的医学检测项目最多。
[0003]谱峰检测是LC

MS/MS数据处理最为核心的部分,直接影响仪器的最终分析结果。对谱峰检测方法的优化能以最小的成本带来仪器性能指标的提升。提升谱峰检测方法对于微弱谱峰和重叠峰的检测能力,能够有效提高仪器的灵敏度和分辨率指标。所以,现在有必要提供一种可靠的谱峰检测方法。

技术实现思路

[0004]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于噪声估计的谱峰识别方法及系统。本专利技术的主要原理是色谱峰信号要远远高于噪声信号,通过比较色谱峰信号与噪声的强度值以及信噪比估计值,来确定峰的顶点以及峰的起始点。
[0005]为实现上述目的,本专利技术采用的技术方案是:一种基于噪声估计的谱峰识别方法,包括以下步骤:
[0006]1)输入原始色谱数据R0,R0经预处理后的数据R1再采用S

G平滑算法进行平滑处理得到数据R2;
[0007]2)针对数据R2,采用寻峰算法识别峰顶点,得到峰顶点集合P;
[0008]3)计算预处理后的数据R1中的每个点的信噪比估计值;
[0009]4)寻找峰顶点集合P中每个峰的峰起点:
[0010]对于峰顶点集合P中的峰顶点pi,在数据R1中寻找与峰顶点pi最近的点,作为数据R1中选择的峰顶点,记为pi
current

[0011]遍历数据R1中点pi
current
左边所有的点,当某一个点pi
s
同时满足以下条件a1、b1、c1时,则将点pi
s
作为峰顶点pi对应的峰起点:
[0012]a1、点pi
s
的信号强度比峰顶点pi右边1/2个峰宽W范围内的所有点的信号强度均低;
[0013]b1、点pi
s
到点p
current
的保留时间的差的绝对值小于预先设定的峰宽W;
[0014]c1、点pi
s
的信噪比估计值大于输入的信噪比阈值T1;
[0015]遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰起点;
[0016]5)寻找每个峰的峰终点:
[0017]遍历数据R1中点p
current
右边所有的点,当某一个点pi
d
同时满足以下条件a2、b2、c2时,则将点pi
d
作为峰顶点pi对应的峰终点:
[0018]a2、点pi
d
的信号强度比峰顶点pi左边所有点的信号强度均低;
[0019]b2、点p
current
到点pi
d
的保留时间的差的绝对值小于预先设定的峰宽W;
[0020]c2、点pi
d
的信噪比估计值大于输入的信噪比阈值T1;
[0021]遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰终点;
[0022]6)根据每个峰顶点p
current
以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。
[0023]优选的是,所述步骤1)中,对原始色谱数据R0进行预处理的方法为:
[0024]对于原始色谱数据R0中的每个数据点,采用每个数据点的前一个和后一个数据点的平均值来代替,处理后的数据即为数据R1,计算公式为:
[0025]f[R0(x)]=[R0(x

1)
×
λ1+R0(x)
×
λ2+R0(x+1)
×
λ3]/(λ1+λ2+λ3);
[0026]其中,R0(x)表示原始色谱数据R0中的数据点,f[R0(x)]表示预处理后的数据点,λ1、λ2、λ3均为权重系数。
[0027]优选的是,其中,λ1=0.5,λ2=1,λ3=0.5;
[0028]优选的是,所述步骤2)中采用的寻峰算法具体包括以下步骤:
[0029]2‑
1)输入数据R1,设定信噪比阈值T2;
[0030]2‑
2)计算预处理后的数据R1中的每个点的信噪比估计值;
[0031]2‑
3)对于数据R1,当其中的一个点同时满足以下条件
①‑⑤
时,则将当前点作为峰顶点:
[0032]①
当前点的信号强度值同时大于左边第一个点的信号强度值和右边第一个点的信号强度值;
[0033]②
当前点、当前点左边的第一个点、当前点右边的第一个点的信噪比估计值均大于信噪比阈值T2;
[0034]③
当前点左边的第二个点的信号强度值小于当前点左边的第一个点的信号强度值;
[0035]④
当前点右边的第二个点的信号强度值小于当前点右边的第一个点的信号强度值;
[0036]⑤
当前点左边的第二个点和右边的第二个点的信噪比估计值均大于信噪比阈值T2;
[0037]2‑
4)遍历数据R1中的所有点,按照所述步骤2

3)的方法,找出数据R1中的所有峰顶点,构建得到峰顶点集合P。
[0038]优选的是,所述步骤2)和步骤3)中计算信噪比估计值的方法包括以下步骤:
[0039]S1、将数据R1分为若干个数据单元,对于每一个数据单元,按照以下方法计算数据单元中的所有数据点的信噪比估计值;
[0040]S2、计算数据单元中所有数据点的期望E(X)和标准差STDEV(X),其中X表示构成数
据点的向量,记数据选择阈值为INS
MAX
,INS
MAX
=E(X)+ηSTDEV(X),η为常数;
[0041]将数据R1的直方图的箱数设置为N
bin
,则直方图被划分为N
bin
段,每一段的范围长度INS
SIZE
为:
[0042][0043]从而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于噪声估计的谱峰识别方法,其特征在于,包括以下步骤:1)输入原始色谱数据R0,R0经预处理后的数据R1再采用S

G平滑算法进行平滑处理得到数据R2;2)针对数据R2,采用寻峰算法识别峰顶点,得到峰顶点集合P;3)计算预处理后的数据R1中的每个点的信噪比估计值;4)寻找峰顶点集合P中每个峰的峰起点:对于峰顶点集合P中的峰顶点pi,在数据R1中寻找与峰顶点pi最近的点,作为数据R1中选择的峰顶点,记为pi
current
;遍历数据R1中点pi
current
左边所有的点,当某一个点pi
s
同时满足以下条件a1、b1、c1时,则将点pi
s
作为峰顶点pi对应的峰起点:a1、点pi
s
的信号强度比峰顶点pi右边1/2个峰宽W范围内的所有点的信号强度均低;b1、点pi
s
到点p
current
的保留时间的差的绝对值小于预先设定的峰宽W;c1、点pi
s
的信噪比估计值大于输入的信噪比阈值T1;遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰起点;5)寻找每个峰的峰终点:遍历数据R1中点p
current
右边所有的点,当某一个点pi
d
同时满足以下条件a2、b2、c2时,则将点pi
d
作为峰顶点pi对应的峰终点:a2、点pi
d
的信号强度比峰顶点pi左边所有点的信号强度均低;b2、点p
current
到点pi
d
的保留时间的差的绝对值小于预先设定的峰宽W;c2、点pi
d
的信噪比估计值大于输入的信噪比阈值T1;遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰终点;6)根据每个峰顶点p
current
以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。2.根据权利要求1所述的基于噪声估计的谱峰识别方法,其特征在于,所述步骤1)中,对原始色谱数据R0进行预处理的方法为:对于原始色谱数据R0中的每个数据点,采用每个数据点的前一个和后一个数据点的平均值来代替,处理后的数据即为数据R1,计算公式为:f[R0(x)]=[R0(x

1)
×
λ1+R0(x)
×
λ2+R0(x+1)
×
λ3]/(λ1+λ2+λ3);其中,R0(x)表示原始色谱数据R0中的数据点,f[R0(x)]表示预处理后的数据点,λ1、λ2、λ3均为权重系数。3.根据权利要求1所述的基于噪声估计的谱峰识别方法,其特征在于,其中,λ1=0.5,λ2=1,λ3=0.5。4.根据权利要求2所述的基于噪声估计的谱峰识别方法,其特征在于,所述步骤2)中采用的寻峰算法具体包括以下步骤:2

1)输入数据R1,设定信噪比阈值T2;2

2)计算预处理后的数据R1中的每个点的信噪比估计值;2

3)对于数据R1,当其中的一个点同时满足以下条件
①‑⑤
时,则将当前点作为峰顶点:

当前点的信号强度值同时大于左边第一个点的信号强度值和右边第一个点的信号
强度值;

当前点、当前点左边的第一个点、当前点右边的第一个点的信噪比估计值均大于信噪比阈值T2;

当前点左边的第二个点的信号强度值小于当前点左边的第一个点的信号强...

【专利技术属性】
技术研发人员:贾明正程文播李亮王晶凌星
申请(专利权)人:中国科学院苏州生物医学工程技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1