一种基于代谢物定性定量数据的非靶向代谢组分析方法技术

技术编号：37603880 阅读：18 留言：0更新日期：2023-05-18 11:55

本发明专利技术公开了一种基于代谢物定性定量数据的非靶向代谢组分析方法，其特征在于，包括如下步骤：数据预处理、实验数据质量评估、代谢物基本统计分析、单变量统计分析、多元统计分析、差异分析、差异代谢物通路富集分析、分析结果整理。本发明专利技术的有益效果在于：分析内容丰富，涵盖市场所需绝大部分分析内容；操作简便，根据配置文件，自动整合各步骤的数据分析、可视化以及结果整理，继而快速生成报告，分析效率高，可同时进行多批数据的分析。可同时进行多批数据的分析。可同时进行多批数据的分析。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于代谢物定性定量数据的非靶向代谢组分析方法

[0001]本专利技术涉及生物信息
，更具体地说，它涉及一种基于代谢物定性定量数据的非靶向代谢组分析方法。

技术介绍

[0002]代谢组学指利用质谱等技术，对生物样本中所有低分子量的代谢产物进行定性和定量，并寻找代谢物与生理病理变化的相关关系的一门科学，是转录组学和蛋白质组学的延伸，能够更直接、更准确地反映生物体的生理状态。目前代谢组学广泛应用于各研究领域，在疾病诊断、药靶筛选、营养与健康管理、个性化药物治疗、植物生长发育与抗逆等各个研究方向受到越来越多的关注，其中，非靶向代谢组能够对样本中的各类代谢物进行无偏向、大规模、系统性的检测，最大程度反映生物体内的代谢水平扰动情况，相关的数据分析需求也日益增加，因此开发一套相应的自动化分析方法非常重要，而现有的分析工具存在如下几点不足：（1）目前已有代谢组自动化分析工具MeataboAnalyst在对代谢组数据进行整套分析时，需要人工完成对结果的整理以及每步工作的衔接，操作步骤相对较多，比较浪费人工和时间。
[0003]（2）代谢物通路富集的映射物种选择有限，往往只针对模式生物或特定物种，对于特殊样本的映射物种选择范围窄；（3）无法同时进行多批数据的分析。

技术实现思路

[0004]针对现有技术存在的不足，本专利技术的目的在于提供一种基于代谢物定性定量数据的非靶向代谢组分析方法，旨在解决上述技术问题。
[0005]为实现上述目的，本专利技术提供了如下技术方案：一种基于代谢物定性定量数据的...

【技术保护点】

【技术特征摘要】
1.一种基于代谢物定性定量数据的非靶向代谢组分析方法，其特征在于，包括以下步骤：步骤一，准备并读取config文件，config文件中包括：正负离子模式下代谢物定性定量数据、样本名对应关系文件、分组名对应关系文件、比较组文件、差异代谢物筛选参数设定、任务名称、分析结果保存路径；步骤二，数据预处理：包括对预先准备的原始数据中目标代谢物在半数及半数以上样本中的表达量进行检查，再对表达量为缺失值和异常值时的情形进行处理并调整数据格式；步骤三，数据质量评估：从总体样本主成分分析、QC样本相关性、QC样本离子峰丰度的相对标准偏差这三个方面评估预处理后的数据质量；步骤四，代谢物基本统计分析：通过代谢物基本统计分析对代谢物的分类和表达量进行统计分析与可视化；步骤五，单变量统计分析：计算对照组和处理组之间代谢物的差异倍数，并使用t检验计算差异显著性pvalue值；步骤六，多元统计分析：借助R语言的ropls软件包，用多元统计的方法对代谢组数据进行降维和归类分析，从中挖掘提炼信息，该信息包括VIP值；步骤七，差异分析：默认使用结合单变量统计分析得到的差异倍数、pvalue值以及多元统计分析计算出的VIP值作为标准，筛选出差异代谢物；步骤八，差异代谢物通路富集分析：对筛选得到的差异代谢物，结合原始数据中的代谢物注释数据，使用脚本根据超几何检验得到差异代谢物显著富集的通路；步骤九，结果整理：对用于生成非靶向代谢组数据分析结果报告的统计分析结果进行整理。2.根据权利要求1所述的一种基于代谢物定性定量数据的非靶向代谢组分析方法，其特征在于，所述步骤二中对原始数据的检查方式如下：首先，若数据中某代谢物在半数及半数以上样本中的表达量都...

【专利技术属性】
技术研发人员：孟玉，孙子奎，
申请(专利权)人：南京派森诺基因科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人