一种新污染物非靶向筛查的高分辨质谱数据处理方法技术

技术编号:39811006 阅读:10 留言:0更新日期:2023-12-22 19:28
本发明专利技术提供了一种新污染物非靶向筛查的高分辨质谱数据处理方法,属于质谱数据处理技术领域。方法将利用DIA模式下的MS1数据和MS2数据分别进行峰提取,并将MS2的相关二级信息分配给MS1的色谱峰,以获得每个化合物的碎片信息;此外,基于每个化合物的保留时间和质量,再依次获得DDA模式下的二级谱图信息,两种方法可以互相弥补可能漏掉的碎片。本发明专利技术解决了运用高分辨质谱仪器进行环境样品的非靶向筛查方法生成的数据量极大且缺乏数据处理方法的问题,大大提高新污染物的检测通量,并充分发挥DDA和DIA的优势,提高鉴定的效率和准确度。度。度。

【技术实现步骤摘要】
一种新污染物非靶向筛查的高分辨质谱数据处理方法


[0001]本专利技术涉及质谱数据处理
,具体是涉及一种新污染物非靶向筛查的高分辨质谱数据处理方法。

技术介绍

[0002]近年来,运用高分辨质谱仪器进行环境样品的非靶向筛查是开展环境新污染物监测的一种新兴方式。
[0003]高分辨质谱仪是一种用于化合物定性的分析仪器。相比于传统四极杆质谱,高分辨质谱仪(包括飞行时间质谱、轨道井质谱等)的分辨率有极大的提升(一般在10000FWHM以上),测定的质量偏差通常在10ppm以内。根据采集方式的不同,高分辨率质谱仪的原始数据可以分成数据依赖型采集(DDA)和数据非依赖型采集(DIA)两种。
[0004]DDA(Data Dependent Acquisition,数据依赖性采集)模式即数据依赖性采集模式,DDA模式包括质谱内部选择过程。当前扫描到的所有母离子中哪一个会最终进入二级碎裂,是根据它的信号强度来定,通常是以从强到弱的顺序去解析,并动态排除时间。因此DDA模式采集速率的限制不可避免会造成的信息采集不全的问题。
[0005]DIA(data

independent acquisition,数据非依赖性采集)技术是近年来发展起来的一种新的质谱技术,属于非标记蛋白质组学方法。DIA模式采用数据非依赖性扫描模式:将质谱整个全扫描范围分为若干个窗口,然后对每个窗口中的所有离子进行检测、碎裂,从而无遗漏、无差异地获得样本中所有离子的信息。从而降低样本检测的缺失值,同时提高定量准确性和重复性,实现大样本队列中高稳定,高精准的蛋白质组定量分析,但是DIA模式数据处理复杂、成本比较高。
[0006]综上可知,由于运用高分辨质谱仪器进行环境样品的非靶向筛查方法生成的数据量极大,因而高效、稳健的数据处理方法的缺失将导致高分辨质谱仪器在环境领域的开发与运用受到限制。

技术实现思路

[0007]本专利技术解决的技术问题是:由于运用高分辨质谱仪器进行环境样品的非靶向筛查方法生成的数据量极大,因而高效、稳健的数据处理方法的缺失将导致高分辨质谱仪器在环境领域的开发与运用受到限制。
[0008]为解决上述问题,本专利技术的技术方案如下:
[0009]本专利技术提供了一种新污染物非靶向筛查的高分辨质谱数据处理方法,包括以下步骤:
[0010]S1、对所有样品进行数据非依赖性采集处理,得到每个样品的一级质谱数据和二级质谱数据;
[0011]S2、基于信息对列表,对齐各个样品及空白对照组的质荷比和保留时间;
[0012]S3、进行空白对照并得到各个样品的特征峰;
[0013]S4、对污染物的各个样品进行数据依赖性采集处理,并将得到的各个样品的二级质谱数据关联到各个样品特有的特征峰中;
[0014]S5、对关联后的特征峰及二级质谱数据进行数据库匹配,并根据匹配结果对样品中化合物的定性结果进行可信度分级。
[0015]进一步地,步骤S1包括以下步骤:
[0016]S1

1、对样品进行色谱分离和质谱扫描,得到质谱数据:
[0017]对污染物进行采样得到各个样品,并对样品进行液相色谱分离,再通过高分辨质谱仪对各个样品进行质谱扫描,得到各个样品的质谱数据;
[0018]S1

2、对质谱数据进行峰提取和碎片分配,得到一级质谱数据的特征峰:
[0019]对质谱数据进行峰提取,即对质谱数据的一级质谱数据通道和二级质谱数据通道同步进行峰提取,并对二级质谱数据通道提取的色谱峰进行判断,将认定为一级质谱数据对应化合物的碎片离子的色谱峰关联至对应的一级质谱数据通道提取的色谱峰,最终得到一级质谱数据的特征峰;
[0020]S1

3、根据特征峰的保留时间和精确质量,对一级质谱数据的特征峰中的加合离子峰和同位素峰进行标记:
[0021]在一级质谱数据的特征峰中,筛选出保留时间偏差在0.05min之内的特征峰,在此基础上:
[0022]对筛选得到特征峰的质量进行两两比较,将质量相对较小的特征峰命名为A,将质量相对较大的特征峰命名为B,
[0023]当A与B的质量偏差为1.003
±
0.015Da且B的特征峰峰强度低于A的特征峰峰强度的50%时,则将B标记为A的C13同位素峰,
[0024]当A与B的质量偏差为1.997
±
0.015Da且满足A:B质谱峰强度比3:1的关系时,则将B标记为A的Cl同位素峰,
[0025]当A与B的质量偏差为21.987
±
0.015Da,则将B标记为A的Na+加合物峰,
[0026]当A与B的质量偏差为37.961
±
0.015Da,则将B标记为A的K
+
加合物峰。
[0027]进一步地,对质谱数据的一级质谱数据通道和二级质谱数据通道同步进行峰提取时,将峰提取参数的阈值设置为15,峰宽阈值设置为2,峰提取步长设置为0.015Da。。
[0028]更进一步地,所述认定为一级质谱数据对应化合物的碎片离子的色谱峰的依据为:一级质谱通道提取离子的色谱峰的保留时间与二级质谱通道提取离子的色谱峰的保留时间相差小于
±
0.05min,且一级质谱通道提取离子的质荷比小于二级质谱通道提取离子的质荷比减一。
[0029]优选地,步骤S2包括以下步骤:
[0030]S2

1、收集步骤S1得到各个样品一级质谱数据的特征峰的保留时间和质量,将质量偏差小于0.015Da且保留时间小于0.1min的峰对齐得到保留时间

质量信息对,形成一个无重复的信息对列表,
[0031]S2

2、基于信息对列表,对各个样品和所有空白对照组的一级质谱数据进行色谱峰提取,并对信息对列表中内的色谱信号进行积分获得峰面积。
[0032]优选地,所述空白对照组包括:分别对步骤S1中样品进行运输空白、方法空白、溶剂空白处理后的三个对照样品。
[0033]优选地,步骤S3包括以下内容:
[0034]获取各个样品及空白对照组对齐后产生的保留时间

质荷比信息对列表,以及所获得的峰面积,将各个样品中峰面积平均值比对应空白对照组的峰面积平均值高出5倍,且与对应空白对照组相比具有显著性差异的色谱峰保留,作为各个样品特有的特征峰,显著性差异的判断依据为:p<0.05。
[0035]优选地,步骤S4包括以下步骤:
[0036]S4

1、获取各个样品,并通过Waters液相色谱分离,再通过高分辨质谱仪的对各个样品进行质谱扫描,在质谱扫描的过程中,设置强度最高的前七个质量进行二级质谱分析,得到数据依赖性采集处理的质谱数据;
[0037]S4

2、依次获取各个样品特有的特征峰的保本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种新污染物非靶向筛查的高分辨质谱数据处理方法,其特征在于,包括以下步骤:S1、对所有样品进行数据非依赖性采集处理,得到每个样品的一级质谱数据和二级质谱数据;S2、基于信息对列表,对齐各个样品及空白对照组的质荷比和保留时间;S3、进行空白对照并得到各个样品的特征峰;S4、对污染物的各个样品进行数据依赖性采集处理,并将得到的各个样品的二级质谱数据关联到各个样品特有的特征峰中;S5、对关联后的特征峰及二级质谱数据进行数据库匹配,并根据匹配结果对样品中化合物的定性结果进行可信度分级。2.如权利要求1所述的一种新污染物非靶向筛查的高分辨质谱数据处理方法,其特征在于,所述步骤S1包括以下步骤:S1

1、对样品进行色谱分离和质谱扫描,得到质谱数据:对污染物进行采样得到各个样品,并对样品进行液相色谱分离,再通过高分辨质谱仪对各个样品进行质谱扫描,得到各个样品的质谱数据;S1

2、对质谱数据进行峰提取和碎片分配,得到一级质谱数据的特征峰:对质谱数据进行峰提取,即对质谱数据的一级质谱数据通道和二级质谱数据通道同步进行峰提取,并对二级质谱数据通道提取的色谱峰进行判断,将认定为一级质谱数据对应化合物的碎片离子的色谱峰分关联至对应的一级质谱数据通道提取的色谱峰,最终得到一级质谱数据的特征峰;S1

3、根据特征峰的保留时间和精确质量,对一级质谱数据的特征峰中的加合离子峰和同位素峰进行标记:在一级质谱数据的特征峰中,筛选出保留时间偏差在0.05min之内的特征峰,在此基础上:对筛选得到特征峰的质量进行两两比较,将质量相对较小的特征峰命名为A,将质量相对较大的特征峰命名为B,当A与B的质量偏差为1.003
±
0.015Da且B的特征峰峰强度低于A的特征峰峰强度的50%时,则将B标记为A的C13同位素峰,当A与B的质量偏差为1.997
±
0.015Da且满足A:B质谱峰强度比3:1的关系时,则将B标记为A的Cl同位素峰,当A与B的质量偏差为21.987
±
0.015Da,则将B标记为A的Na+加合物峰,当A与B的质量偏差为37.961
±
0.015Da,则将B标记为A的K
+
加合物峰。3.如权利要求2所述的一种新污染物非靶向筛查的高分辨质谱数据处理方法,其特征在于,所述对质谱数据的一级质谱数据通道和二级质谱数据通道同步进行峰提取时,将峰提取参数的阈值设置为15,峰宽阈值设置为2,峰提取步长设置为0.015Da。4.如权利要求2所述的一种新污染物非靶向筛查的高分辨质谱数据处理方法,其特征在于,所述认定为一级质谱数据对应化合物的碎片离子的色谱峰的依据为:一级质谱通道提取离子的色谱峰的保留时间与二级质谱通道提取离子的色谱峰的保留时间相差小于
±
0.05min,且一级质谱通道提取离子的质荷比小于二级质谱通道提取离...

【专利技术属性】
技术研发人员:王锐刘鹤赵波谢丹平闫雅楠
申请(专利权)人:生态环境部华南环境科学研究所生态环境部生态环境应急研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1