System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于二级质谱定性结果的代谢组学色谱峰提取方法技术_技高网

一种基于二级质谱定性结果的代谢组学色谱峰提取方法技术

技术编号:40025159 阅读:11 留言:0更新日期:2024-01-16 17:22
本发明专利技术公开了一种基于二级质谱定性结果的代谢组学色谱峰提取方法。该方法从代谢组学的二级质谱出发,基于二级质谱在定性库中的定性结果,结合XCMS(XML Cryptographic Message Syntax)峰提取结果,以获取更加全面的色谱峰表信息。本发明专利技术从蕴含更多质谱信息,且具有明确化学物质涵义的二级质谱特征出发,进行代谢组学检测数据的色谱峰提取,提升了色谱峰提取的准确性,也明确了代谢组学色谱峰具体的生物意义,有利于进一步的代谢组学差异物发现、通路分析与生物学意义解释。说明书附图中的图1为本发明专利技术的流程图。

【技术实现步骤摘要】

本专利技术公开了“一种基于二级质谱定性结果的代谢组学色谱峰提取方法”,属于数据科学领域,用于从高分辨率质谱检测数据中提取色谱峰,提升色谱峰提取准确性,增强色谱峰的生物意义。


技术介绍

1、代谢组学采用高分辨率检测仪器,检测代谢物质在不同类别样本(比如病症初期、病症中期、病症晚期等)的含量,通过分析其变化规律分析,挖掘代谢物质在不同类别样本中的变化趋势,是系统生物学的重要组成部分,在到包括疾病诊断、毒理学、植物学、营养食品科学、环境学等领域被广泛应用,具有非常广泛的应用前景。

2、然而,由于代谢物的复杂性,代谢组学检测数据的处理仍存在诸多困难。例如,据统计,人类血清中就含有超过1,000种代谢物,植物中含有4,000~25,000种代谢物。而且受到背景离子与随机噪声的影响,使得从代谢组学检测数据准确检测出蕴含代谢物特征的色谱峰更具挑战性。

3、目前,在代谢组学分析中,常用的色谱峰提取方法有xcms、mzmine、metalign、openms等方法,这些方法均是从代谢组学数据自身出发,采用化学计量学等技术,基于一级质谱信息,从检测数据中提取色谱峰。这些方式没有完全考虑色谱峰所蕴含的化合物生物信息,也未充分利用检测数据的二级质谱信息,导致色谱峰的误检、漏检现象时有发生,影响后续的定性鉴定、差异物分析、通路分析等代谢组学分析操作的结果。

4、基于此,本专利技术发展一种基于二级质谱定性结果的代谢组学色谱峰提取方法。该方法,首先,充分利用检测数据的二级质谱信息,通过对二级质谱的定性,为检测数据的二级质谱赋予化学生物涵义;然后,基于二级质谱的保留时间、质荷比信息,细致定位一级质谱数据中的色谱峰搜索范围,提高色谱峰提取正确性的同时,赋予色谱峰明确的化学生物涵义,减少色谱峰的误检、漏检。


技术实现思路

1、本专利技术要解决的问题是提供一种基于二级质谱定性结果的代谢组学色谱峰提取方法。

2、为实现上述目的,本专利技术采用的技术方案为:

3、基于二级质谱定性结果的代谢组学色谱峰提取方法,包括如下步骤:

4、(1)步骤1:提取代谢组学检测数据中二级质谱数据,与对二级质谱数据进行去噪预处理。

5、步骤2:根据二级质谱数据的相似性,进行二级质谱数据筛选。

6、步骤3:基于二级质谱特征,结合定性数据库,实现二级质谱定性分析,确定二级质谱的化学物质涵义。

7、步骤4:基于二级质谱定性结果,提取色谱峰,构建代谢组学检测数据峰表。

8、与现有技术相比,本专利技术发展一种基于二级质谱定性结果的代谢组学色谱峰提取方法,具有如下的优异效果:①提高了检测效率,本专利技术充分利用了二级质谱信息进行色谱峰提取,缩小了色谱峰搜索范围,避免了在整个保留时间和整个质荷比范围搜索色谱峰,提高了色谱峰的检测效率;也避免了漏检、误检的发生;②避免了色谱峰的漏检、误检,本专利技术充分利用了二级质谱信息进行色谱峰提取,根据二级质谱的母离子保留时间与质荷比,确定色谱峰搜索范围,避免了因为系统噪声等因素导致的色谱峰漏检、误检;③本专利技术所提取的色谱峰具备充分的色谱峰完整的化学生物涵义,色谱峰提取的目的是方便代谢组学后续定性鉴定、差异物分析、通路分析,进而挖掘检测样本内/间的生物意义,本专利技术针对具有定性结果(即具有充分化学生物意义)的二级质谱进行色谱峰提取,使得所提取的色谱峰均具有充分的化学生物意义,避免了传统方法提取的并不具备具体化学生物意义的色谱峰,对代谢组学后续后续定性鉴定、差异物分析、通路分析的影响。

本文档来自技高网...

【技术保护点】

1.一种基于二级质谱定性结果的代谢组学色谱峰提取方法,其特征在于,采用二级质谱的定性结果作为色谱峰提取的依据,不仅增加了代谢组学色谱峰的数量,也明确了代谢组学色谱峰具体的生物意义,有利于进一步的代谢组学差异物发现、通路分析与生物学意义解释。包括下述步骤:

2.根据权利要求1所述的代谢组学检测数据二级质谱数据去噪预处理方法,其特征在于,所述的步骤1具体方法如下:

3.根据权利要求1所述的二级质谱筛选方法,其特征在于,所述的步骤2具体方法如下:

4.根据权利要求1所述的二级质谱定性方法,其特征在于,所述的步骤3具体方法如下:

5.根据权利要求1所述的色谱峰提取方法,其特征在于,所述的步骤4具体方法如下:

【技术特征摘要】

1.一种基于二级质谱定性结果的代谢组学色谱峰提取方法,其特征在于,采用二级质谱的定性结果作为色谱峰提取的依据,不仅增加了代谢组学色谱峰的数量,也明确了代谢组学色谱峰具体的生物意义,有利于进一步的代谢组学差异物发现、通路分析与生物学意义解释。包括下述步骤:

2.根据权利要求1所述的代谢组学检测数据二级质谱数据去噪预处...

【专利技术属性】
技术研发人员:曾仲大陈爱明文里梁
申请(专利权)人:大连达硕信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1