System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法技术

技术编号:40202849 阅读:4 留言:0更新日期:2024-02-02 22:15
本发明专利技术提供了一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法。通过采集目标菌株、参照菌株和空培养基的一级、二级质谱代谢组数据,以参照菌株和空培养基的代谢组数据作为对照,对目标菌株代谢组中无价值的干扰化合物信号进行去重复排除,保留并优选产物中真实的次级代谢产物信号,本发明专利技术在一级质谱上相比于直接基于质荷比的排重,基于adduct进行准确分子量计算后进行数据库比对可以更准确地排除相同的化合物信号。此外,本发明专利技术的二级质谱比对是基于碎片匹配不依赖碎片强度进行结构类似物识别,筛选结果稳定。对于难以进行遗传操作的菌株、表达水平较低且难以通过常规手段检测的隐性代谢产物挖掘而言具有重要意义。

【技术实现步骤摘要】

本专利技术涉及天然产物药物领域,特别涉及基于高分辨质谱信号的比较代谢组排重及优选化合物方法


技术介绍

1、微生物的次级代谢产物是药物先导化合物的重要来源,采用高分辨质谱的方法能够获得微生物较为全面的代谢产物信号,然而高分辨质谱的灵敏性也使得数据量庞大,而如何从海量代谢产物数据中提取出有效信息,准确获得新天然产物的质谱信号是新化合物挖掘成功的关键。


技术实现思路

1、针对上述情况,为克服现有技术的缺点与不足,本专利技术提供了基于高分辨质谱的信号优选策略,以空白培养基和参照菌株培养物代谢组质谱数据作为排重对照,通过采集空培养基、参照菌株、目标菌株代谢物多级质谱,采用基于比较代谢组的一级质谱、二级质谱结合的差异分析、信号排重及优选策略,排除无效假阳性化合物信号,优选出有效的目标菌株次级代谢产物分子,实现在海量信号中锚定目标菌株的真实的代谢产物信号。

2、本专利技术的目的是通过以下技术方案来实现的:

3、一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法,具体为:

4、对目标菌株进行基因组同源相似性分析,以基因组同源相似性分析后的亲缘关系相近的菌株作为参照菌株,与目标菌株在相同条件下进行发酵;

5、对参照菌株和目标菌株的发酵液和空培养基进行处理后,采集一级高分辨质谱信号,对采集到的一级高分辨质谱信号分子进行准确分子量预测,并以空培养基和参照菌株的一级质谱信号为对照,筛选仅在目标菌株的发酵液中出现的准确分子量信号并输出排重后的目标菌株质谱信号列表;

6、以目标菌株质谱信号列表为对象采集靶向二级质谱信号或在其非靶向二级质谱信号中提取质谱列表中信号,同时对参照菌株的发酵液和空培养基采集非靶向二级质谱信号,并构建目标菌株靶向二级信号-对照非靶向二级信号分子网络图,若分子网络图的单一簇中信号有超过m来自于目标菌株,则保留该簇中的信号,否则将信号作为初级代谢产物或培养基衍生物进行排除,最后输出筛选后的目标菌株产物信号。

7、进一步地,所述对采集到的一级高分辨质谱信号分子进行准确分子量预测,并以空培养基和参照菌株的一级质谱信号为对照,筛选仅在目标菌株的发酵液中出现的准确分子量信号并输出排重后的目标菌株质谱信号列表,具体为:

8、分别对参照菌株、目标菌株的发酵液和空培养基三个样品的一级高分辨质谱信号进行峰识别;

9、根据adduct计算规则,对每一样品的一级高分辨质谱信号进行adduct识别;同时对于同一保留时间下,计算不同质荷比之间的差值,将高频率的差值加入adduct计算规则,进一步识别adduct;

10、根据质荷比的信号强度进行筛选,去除每一样品的一级高分辨质谱信号中低于给定阈值的信号;

11、基于给定的误差范围,把每一样品的一级高分辨质谱信号中相近保留时间、相近质荷比信号进行样品内合并;

12、根据adduct识别的结果和单一同位素质量,对每一样品的一级高分辨质谱信号计算化合物可能的准确分子量;

13、基于给定的误差范围,根据准确分子量和保留时间将存在于空培养基或参照菌株的发酵液的一级高分辨质谱信号中的信号排除,输出排重后的目标菌株质谱信号列表。

14、进一步地,构建目标菌株靶向二级信号-对照非靶向二级信号分子网络图(simrank network算法)的方法具体如下:

15、以目标菌株质谱信号列表为对象采集靶向二级质谱信号,将二级质谱信号中同一母离子来源的谱图进行合并,获得母离子对应的二级谱图;

16、对参照菌株的发酵液和空培养基采集非靶向二级质谱信号,对空培养基样品的二级谱图以及参照菌株样品的二级谱图进行提取和合并,获得母离子对应的二级谱图;

17、将每张二级谱图上的碎片信号按照强度从高到低排列,保留前n位的碎片,n≤30;

18、将目标菌株样品中的二级谱图、参照菌株的二级谱图、空培养基样品的二级谱图分别进行两两比对,构建对应的第一矩阵,第一矩阵的大小为31*30;其中,第一矩阵的元素表示待比对的两张二级谱图各碎片的比对结果,其中,第31行某一位值为1表示待比对的两张二级谱图的谱图a相应的碎片没有比对到谱图b中的任何碎片,第i行第j列元素,i=1,2,3…,n,则表示待比对的两张二级谱图的谱图a的第i个碎片与谱图b的第j个碎片的比对结果,若谱图a的第i个碎片与谱图b的第j个碎片质荷比在给定误差范围内或差值与对应的a、b母离子的差值在给定误差范围内则比对上,取值为1,否则为0;

19、分别将第一矩阵和一个第二矩阵进行相乘,得到表示两张谱图相似度的数值;

20、将相似度超过阈值的二级谱图对应的母离子信号进行线段相连,构建获得目标菌株靶向信号-对照非靶向信号分子网络图。

21、进一步地,所述第二矩阵具体如下:

22、

23、进一步地,还包括:根据目标菌株产物信号中保留的有效信号分子的相关信息按照信号强度进行优选排序,进行进一步分离纯化的产物信号。

24、进一步地,目标菌株产物信号中保留的有效信号分子的相关信息包括荷质比、保留时间、信号丰度。

25、本专利技术的有有益效果是:一方面是采取了和空白培养基以及参照菌株代谢组一级、二级质谱数据比对的方法,提高了排除无价值信号的比例;另一方面,在一级质谱上相比于直接基于质荷比的排重,如xcms,openms方法,基于adduct进行准确分子量计算后进行数据库比对可以更准确地排除相同的化合物信号。此外,目前最通用的二级比对方法是基于向量点积衍生而来,例如cosine相似度等。但lc-msms的数据受到仪器条件、实验条件、样品基质等影响,碎片强度波动变化比较大,使得这类方法的结果不稳定。在这一方面,不依赖碎片强度的二级谱图比对方法更有优势,譬如基于碎片匹配的x-rank算法。但x-rank主要用于数据库匹配,不是为结构类似物识别设计的。而本专利技术的二级质谱比对是基于碎片匹配不依赖碎片强度进行结构类似物识别。综上,全新的高分辨质谱优化策略对于难以进行遗传操作的菌株、表达水平较低且难以通过常规手段检测的隐性代谢产物挖掘而言具有重要意义。

本文档来自技高网...

【技术保护点】

1.一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法,其特征在于,具体为:

2.根据权利要求1所述的方法,其特征在于,所述对采集到的一级高分辨质谱信号分子进行准确分子量预测,并以空培养基和参照菌株的一级质谱信号为对照,筛选仅在目标菌株的发酵液中出现的准确分子量信号并输出排重后的目标菌株质谱信号列表,具体为:

3.根据权利要求1所述的方法,其特征在于,构建目标菌株靶向二级信号-对照非靶向二级信号分子网络图的方法具体如下:

4.根据权利要求3所述的方法,其特征在于,所述第二矩阵具体如下:

5.根据权利要求1所述的方法,其特征在于,还包括:根据目标菌株产物信号中保留的有效信号分子的相关信息按照信号强度进行优选排序,获得可进行进一步分离纯化的产物信号。

6.根据权利要求5所述的方法,其特征在于,目标菌株产物信号中保留的有效信号分子的相关信息包括荷质比、保留时间、信号丰度。

【技术特征摘要】

1.一种基于高分辨质谱信号的比较代谢组排重及优选化合物方法,其特征在于,具体为:

2.根据权利要求1所述的方法,其特征在于,所述对采集到的一级高分辨质谱信号分子进行准确分子量预测,并以空培养基和参照菌株的一级质谱信号为对照,筛选仅在目标菌株的发酵液中出现的准确分子量信号并输出排重后的目标菌株质谱信号列表,具体为:

3.根据权利要求1所述的方法,其特征在于,构建目标菌株靶向二级信号-对照非靶向二...

【专利技术属性】
技术研发人员:徐飞吴钇翰张冉
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1