一种代谢物鉴定及紊乱通路分析方法技术

技术编号:17346571 阅读:39 留言:0更新日期:2018-02-25 11:56
本发明专利技术公开了一种代谢物鉴定和紊乱代谢通路分析方法。本发明专利技术的代谢物鉴定方法利用代谢反应网络中的具有反应关系的第一代谢物、第二代谢物之间结构类似的特点以及反应关系,使用已鉴定出来第一代谢物的二级谱图对与其有反应关系的第二代谢物进行鉴定,进一步使用已鉴定出来的第二代谢物的二级谱图对与其有反应关系的新的第二代谢物进行鉴定,该方法循环进行直到无法鉴定新的第二代谢物,从而扩大代谢物的鉴定覆盖范围;紊乱代谢通路分析方法利用具有反应关系的代谢物在代谢反应网络中聚集的特点,避免错误注释对通路分析的影响,直接得到紊乱网络和紊乱代谢通路信息。

【技术实现步骤摘要】
一种代谢物鉴定及紊乱通路分析方法
本专利技术涉及代谢组学数据分析
,尤其涉及一种基于代谢反应网络的代谢物鉴定和紊乱代谢通路分析方法。
技术介绍
代谢组学主要是通过解析体内小分子的含量和种类的变化来研究生命系统的生理和病理状态。近年来,代谢组学因为其简便、快速、信息量丰富的特点,在生物标志物研究、精准医学等领域得到了广泛的重视和应用。目前,代谢组学的分析技术主要以核磁共振谱(Nuclearmagneticresonance,NMR)和质谱(Massspectrometry,MS)为核心。近年来,质谱技术因为其高灵敏度、高分辨率和宽检测动态范围等特点,在代谢组学领域应用越来越广泛。基于质谱的代谢组学领域,最为重要的便是代谢物的结构鉴定(或者称为注释)以及如何从质谱数据中获取有效的生物学信息。对于代谢物的注释,最为直接并且简单的便是使用一级质谱数据-质核比(Masstochargeratio,m/z)在数据库中进行匹配。然而这种方式却并不可靠,同一个m/z经常对应着多达数十个代谢物。为了解决这个问题,现在更为常用并为大家所公认的就是使用代谢物标准二级谱图(MS/MSspectrum)数据库以及色谱保留时间(Retentiontime,RT)进行代谢物鉴定。这种方法大大提高了代谢物鉴定的精确度和可靠性。然而,这样的方法仍然存在着以下缺点。首先,需要大量的代谢物标准品采集标准二级谱图,标准品的购买以及标准谱图库的建立非常的费时、费力以及费钱,并且有些代谢物的标准品并不能通过商业购买得到。另外,不同质谱平台采集的二级谱图并不完全一致,为了精确的鉴定代谢物,每个用户需要在自己实验室质谱平台上采集标准品的二级谱图,建立标准品二级谱图数据库。因此,通过实验方法建立标准品二级谱图数据库非常困难并且数目也极其有限。其次,不同实验室、不同样品需要不同的流动相体系,同一个实验室的流动相体系可能就多达十种以上,因此对每一种流动相体系都采集代谢物标准品的保留时间也是不现实的。所以,在代谢组学领域,代谢物的结构鉴定已经成为其发展的最大瓶颈之一。针对上述的现有的代谢物的结构鉴定方法存在的问题,需要提供一种成本低、准确性高的代谢物鉴定和紊乱代谢通路分析方法,并且能够克服代谢物标准二级谱图库数量不足的限制。
技术实现思路
为解决上述问题,本专利技术提供一种代谢物鉴定和紊乱代谢通路分析方法,利用代谢反应网络中的一个反应对的两个相邻代谢物的结构类似的特点,根据标准二级谱图库中的已知二级谱图的第一代谢物确定未知二级谱图的第二代谢物,从而克服代谢物标准二级谱图库数量不足的限制。为实现上述目的,本专利技术的一种代谢物鉴定方法,包括如下步骤:S11、建立二级谱图数据库和代谢反应网络数据库,所述二级谱图数据库包括多个第一代谢物对应的多个第一二级图谱,所述代谢反应网络数据库包括由所述第一代谢物以及分别与所述第一代谢物之间具有直接或者间接反应关系的多个第二代谢物构成的代谢反应网络;S12、获取待测生物样品中的多个代谢物峰及各个所述代谢物峰对应的保留时间和实验二级谱图;S13、确定各个所述实验二级谱图与所述第一二级谱图的相似度,将所述代谢物峰确定为与其相似度大于预设匹配值的所述第一二级谱图对应的第一代谢物,并将其作为所述代谢物峰的第一二级谱图鉴定结果;S14、根据所述第一二级谱图鉴定结果对应的代谢物峰的所述保留时间建立保留时间预测模型,并且根据所述保留时间预测模型预测所述代谢反应网络数据库中的各个所述第一代谢物和各个所述第二代谢物的理论保留时间;S15、根据各个所述理论保留时间和各个所述代谢物峰对应的保留时间,将所述代谢物峰确定为与其保留时间的误差在设定误差范围内的理论保留时间所对应的第一代谢物,并将其作为所述代谢物峰的第二二级谱图鉴定结果;S16、根据所述第二二级谱图鉴定结果和所述代谢反应网络数据库,对各个所述代谢物峰进行循环代谢物鉴定,并根据鉴定结果确定所述待测生物样品内各个代谢物峰的最终鉴定结果。进一步地,在所述步骤S14中,建立所述保留时间预测模型之前,先对所述第一二级谱图鉴定结果内的所述代谢物峰进行筛选,得到与所述第一代谢物一一对应匹配的所述代谢物峰,再根据其建立所述保留时间预测模型。进一步地,所述保留时间预测模型采用多元线性模型、随机森林模型、偏最小二乘法、支持向量机模型、人工神经网络中任意一种方法建立。进一步地,在所述步骤S16中,所述循环代谢物鉴定的方法为:将所述第二二级谱图鉴定结果内的各个代谢物峰作为种子,并根据所述第二二级谱图鉴定结果在所述代谢反应网络中寻找第二二级谱图鉴定结果的临近代谢物,与所述待测生物样品中的所述代谢物峰进行匹配,匹配上的第一代谢物或第二代谢物作为匹配上的所述代谢物峰的最终鉴定结果;然后再将鉴定出来的代谢物峰作为新的种子,重复上述鉴定过程,直至没有新的代谢物峰被鉴定出来。进一步地,在所述步骤S16中,还包括,对所述鉴定结果打分,根据打分结果去除冗余数据,得到所述待测生物样品内各个代谢物峰的最终鉴定结果。本专利技术还提供一种基于上述的代谢物鉴定方法的紊乱代谢通路分析方法,包括如下步骤:S21、对待检测的代谢物组进行统计分析,根据分析结果获取多个差异代谢物峰;S22、对所述差异代谢物峰进行紊乱模块分析,确定所述差异代谢物峰对应的紊乱代谢模块和紊乱代谢网络;S23、对所述差异代谢物峰进行紊乱代谢通路分析,确定所述差异代谢物峰对应的紊乱代谢通路;S24、根据所述差异代谢物峰的所述紊乱代谢模块和所述紊乱代谢通路,确定所述紊乱代谢通路中包含的所述代谢物峰的定量数据。进一步地,所述步骤S22中,先通过单变量分析和/或多变量分析对所述差异代谢物峰进行筛选,并对筛选后的所述差异代谢物峰进行紊乱模块分析;其中,被筛选掉的所述差异代谢物峰包括:无所述鉴定结果且不满足设定规则的所述差异代谢物峰。进一步地,所述步骤S22中,所述紊乱模块分析的方法为:使用所述差异代谢物峰所对应的所有鉴定结果从所述代谢反应网络数据库中提取对应的第一代谢物和第二代谢物,构建一个次级网络,利用社群分析算法确定所述次级网络中的所述紊乱模块,对各个所述紊乱模块进行打分并筛选所述紊乱模块,根据筛选后的紊乱模块生成所述紊乱网络。进一步地,所述步骤S23中,确定所述差异代谢物峰对应的所述紊乱代谢通路后,利用代谢通路富集分析方法,校正所述紊乱代谢通路。进一步地,所述定量数据包括所述代谢物的强度的中位值、平均值或者总和。本专利技术的代谢物鉴定和紊乱代谢通路分析方法,能够提供一种新的代谢物鉴定以及紊乱代谢通路分析的方法。本专利技术的代谢物鉴定方法利用代谢反应网络中的具有反应关系的第一代谢物和第二代谢物之间结构类似的特点以及反应关系,使用已鉴定出来第一代谢物的二级谱图对与其有反应关系的第二代谢物进行鉴定,从而扩大代谢物的鉴定覆盖范围。本专利技术的紊乱代谢通路分析方法利用具有反应关系的代谢物在代谢反应网络中聚集的特点,避免错误注释对通路分析的影响,直接得到紊乱网络和紊乱代谢通路信息。附图说明图1为本专利技术实施例代谢物鉴定方法的流程图;图2为本专利技术实施例中的代谢物反应关系示意图;图3为本专利技术实施例紊乱代谢通路分析方法的流程图。具体实施方式下面,结合附图,对本专利技术的结构以及工作原理等作进一步的说明。如图1本文档来自技高网
...
一种代谢物鉴定及紊乱通路分析方法

【技术保护点】
一种代谢物鉴定方法,其特征在于,包括如下步骤:S11、建立二级谱图数据库和代谢反应网络数据库,所述二级谱图数据库包括多个第一代谢物对应的多个第一二级图谱,所述代谢反应网络数据库包括由所述第一代谢物以及分别与所述第一代谢物之间具有直接或者间接反应关系的多个第二代谢物构成的代谢反应网络;S12、获取待测生物样品中的多个代谢物峰及各个所述代谢物峰对应的保留时间和实验二级谱图;S13、确定各个所述实验二级谱图与所述第一二级谱图的相似度,将所述代谢物峰确定为与其相似度大于预设匹配值的所述第一二级谱图对应的第一代谢物,并将其作为所述代谢物峰的第一二级谱图鉴定结果;S14、根据所述第一二级谱图鉴定结果对应的代谢物峰的所述保留时间建立保留时间预测模型,并且根据所述保留时间预测模型预测所述代谢反应网络数据库中的各个所述第一代谢物和各个所述第二代谢物的理论保留时间;S15、根据各个所述理论保留时间和各个所述代谢物峰对应的保留时间,将所述代谢物峰确定为与其保留时间的误差在设定误差范围内的理论保留时间所对应的第一代谢物,并将其作为所述代谢物峰的第二二级谱图鉴定结果;S16、根据所述第二二级谱图鉴定结果和所述代谢反应网络数据库,对各个所述代谢物峰进行循环代谢物鉴定,并根据鉴定结果确定所述待测生物样品内各个代谢物峰的最终鉴定结果。...

【技术特征摘要】
1.一种代谢物鉴定方法,其特征在于,包括如下步骤:S11、建立二级谱图数据库和代谢反应网络数据库,所述二级谱图数据库包括多个第一代谢物对应的多个第一二级图谱,所述代谢反应网络数据库包括由所述第一代谢物以及分别与所述第一代谢物之间具有直接或者间接反应关系的多个第二代谢物构成的代谢反应网络;S12、获取待测生物样品中的多个代谢物峰及各个所述代谢物峰对应的保留时间和实验二级谱图;S13、确定各个所述实验二级谱图与所述第一二级谱图的相似度,将所述代谢物峰确定为与其相似度大于预设匹配值的所述第一二级谱图对应的第一代谢物,并将其作为所述代谢物峰的第一二级谱图鉴定结果;S14、根据所述第一二级谱图鉴定结果对应的代谢物峰的所述保留时间建立保留时间预测模型,并且根据所述保留时间预测模型预测所述代谢反应网络数据库中的各个所述第一代谢物和各个所述第二代谢物的理论保留时间;S15、根据各个所述理论保留时间和各个所述代谢物峰对应的保留时间,将所述代谢物峰确定为与其保留时间的误差在设定误差范围内的理论保留时间所对应的第一代谢物,并将其作为所述代谢物峰的第二二级谱图鉴定结果;S16、根据所述第二二级谱图鉴定结果和所述代谢反应网络数据库,对各个所述代谢物峰进行循环代谢物鉴定,并根据鉴定结果确定所述待测生物样品内各个代谢物峰的最终鉴定结果。2.如权利要求1所述的代谢物鉴定方法,其特征在于,在所述步骤S14中,建立所述保留时间预测模型之前,先对所述第一二级谱图鉴定结果内的所述代谢物峰进行筛选,得到与所述第一代谢物一一对应匹配的所述代谢物峰,再根据其建立所述保留时间预测模型。3.如权利要求1所述的代谢物鉴定方法,其特征在于,所述保留时间预测模型采用多元线性模型、随机森林模型、偏最小二乘法、支持向量机模型、人工神经网络中任意一种方法建立。4.如权利要求1所述的代谢物鉴定方法,其特征在于,在所述步骤S16中,所述循环代谢物鉴定的方法为:将所述第二二级谱图鉴定结果内的各个代谢物峰作为种子,并根据所述第二二级谱图鉴定结果在所述代谢反应网络中寻找第二二级谱图鉴定结果的临近代谢物,...

【专利技术属性】
技术研发人员:朱正江申小涛
申请(专利权)人:中国科学院上海有机化学研究所
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1