【技术实现步骤摘要】
复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法
本专利技术属于气相色谱-质谱联用数据解析
,具体涉及复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法。
技术介绍
GC-MS在众多实验室用于高通量表征复杂样本中的小分子挥发、半性成分。作为目前普及率最高的分析测试仪器之一,GC-MS本身提供的物质谱库为复杂样本分析提供了非常有帮助的工具。但在GC-MS的应用中,复杂样本中化合物的精准解析是当前应用中面临的一个难题。化合物解析包含了两个核心步骤,一是色谱峰的识别,二是共流出组分的解析。在代谢组学等涉及多样本同时分析进行比较的研究中,还包含了如何实现峰对齐的问题。当前,色谱峰的识别多针对TIC中峰提取,围绕这个问题,目前已有一部分卓有成效的方法,但如何在TIC提取的基础上实现共流出化合物的高通量、自动化解析,却是当前应用中的亟待解决的难题。当前方法中对于峰对齐步骤没有给予太多的重视。根据我们的经验,化合物峰对齐不能只是依靠质谱谱图。样本构成复杂时,有可能存在共流出化合物质谱谱图相似的情况。此时,若仅仅依靠质谱谱图进行化合物峰对齐,会导致样本与样本之间存在多重匹配,给出错误的峰对齐结果,最终导致筛查出来的差异性化合物结果不可靠。同时,发展智能化、可靠的GC-MS自动化解析方法实现化合物解析与识别,实现差异性代谢物的筛查,是当前GC-MS技术涉及的科研、检测、工业应用等领域,如食品分析、药物分析、香精香料、工业化学品分析等亟待解决的需求。
技术实现思路
有鉴于此,本专利技术提供一种能够高效完成复杂样本GC-MS自动解析实现化合物 ...
【技术保护点】
1.一种复杂样本GC‑MS自动解析实现化合物准确鉴别与差异性组分筛查的方法,其特征在于,包括以下步骤:a.提取GC‑MS质谱中的TIC色谱峰及EIC色谱峰;b.明确每个所述TIC色谱峰的解析范围,查找解析范围内的所述EIC色谱峰信息;c.根据所查找到的EIC色谱峰信息对所述EIC色谱峰进行聚类,获得每一个类的代表性色谱轮廓谱图;d.构建初始色谱谱图矩阵,利用修正的多元曲线分辨‑交替最小二乘法对初始色谱谱图矩阵进行优化解析,获得每个所述TIC色谱峰下的化学成分的质谱谱图;e.构建质谱谱库,所述质谱谱库中包含标准化合物质谱谱图,将解析所得的每个TIC色谱峰下的化学成分的质谱谱图导入至所述质谱谱库,进行单一样本中化合物的自动识别;f.对不同样本分组,利用统计分析方法筛选组间有差异的代谢物;其中,步骤c中,“对EIC色谱峰进行聚类”方法为:根据每个所述EIC峰色谱轮廓谱图的形状,采用层次聚类法进行聚类,包括以下步骤:c1.采用Pearson相关系数衡量色谱轮廓之间的相似度;c2.将相似度低于预定相似度阈值,并且EIC色谱峰之间的距离大于预定距离阈值的相似度设置为0;c3.根据相关系数从大到小, ...
【技术特征摘要】
1.一种复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法,其特征在于,包括以下步骤:a.提取GC-MS质谱中的TIC色谱峰及EIC色谱峰;b.明确每个所述TIC色谱峰的解析范围,查找解析范围内的所述EIC色谱峰信息;c.根据所查找到的EIC色谱峰信息对所述EIC色谱峰进行聚类,获得每一个类的代表性色谱轮廓谱图;d.构建初始色谱谱图矩阵,利用修正的多元曲线分辨-交替最小二乘法对初始色谱谱图矩阵进行优化解析,获得每个所述TIC色谱峰下的化学成分的质谱谱图;e.构建质谱谱库,所述质谱谱库中包含标准化合物质谱谱图,将解析所得的每个TIC色谱峰下的化学成分的质谱谱图导入至所述质谱谱库,进行单一样本中化合物的自动识别;f.对不同样本分组,利用统计分析方法筛选组间有差异的代谢物;其中,步骤c中,“对EIC色谱峰进行聚类”方法为:根据每个所述EIC峰色谱轮廓谱图的形状,采用层次聚类法进行聚类,包括以下步骤:c1.采用Pearson相关系数衡量色谱轮廓之间的相似度;c2.将相似度低于预定相似度阈值,并且EIC色谱峰之间的距离大于预定距离阈值的相似度设置为0;c3.根据相关系数从大到小,将EIC色谱峰进行聚类。2.如权利要求1所述的复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法,其特征在于,步骤c2中,所述预定相似度阈值为0.95,所述预定距离阈值为0.02min。3.如权利要求1所述的复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法,其特征在于,步骤a中,“提取GC-MS质谱中的TIC及EIC下的色谱峰”包括以下步骤:a1.对所述GC-MS质谱中的TIC色谱信号和EIC色谱信号进行基线校准,以消除背景漂移:采用极小值法,分别提取所述TIC色谱信号和所述EIC色谱信号中的极小值,利用稳健统计分析剔除来源于色谱峰的极小值后,利用线性插值法估算背景漂移,并从原始信号中剔除,获得基线校正后的所述TIC色谱信号和所述EIC色谱信号,作为原始TIC信号及原始EIC信号;a2.对基线校正后的所述TIC色谱信号和所述EIC色谱信号,采用高斯平滑法进行色谱峰的提取:采用一系列不同尺度的高斯函数作为平滑函数,通过卷积运算实现信号平滑;所述TIC色谱信号及所述EIC色谱信号平滑后,获得一系列平滑后信号,提取每一个平滑信号的极大值,筛选不同尺度下平滑后均存在的极大值,作为初始色谱峰;a3.在所述原始TIC信号及原始EIC信号中,剔除初始色谱峰左侧连续上升和右侧连续下降的部分,估计出原始信号中的噪声;将初始色谱峰中高于噪声的部分设置为流出峰;剔除信噪比低于3的初始色谱峰,最终实现所述TIC色谱峰及所述EIC色谱峰的提取。4.如权利要求1或3所述的复杂样本GC-MS自动解析实现化合物准确鉴别与差异性组分筛查的方法,其特征在于,步骤b中,“确定每个TIC峰的解析范围”包括以下步骤:b1.计算流出峰起始位置信号响度与峰最高点位置之间的比值r;b2.将所述TIC色谱峰前半部分流出宽度扩大至(w/r)-5,其中,w表示前半部分的宽度,-5表示向前面延伸5个扫描点,将所述...
【专利技术属性】
技术研发人员:于永杰,张月明,周婕婕,王璇,
申请(专利权)人:宁夏医科大学,
类型:发明
国别省市:宁夏,64
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。