一种多物种GC-MS内源性代谢物数据库及其建立方法技术

技术编号:24858801 阅读:179 留言:0更新日期:2020-07-10 19:10
本发明专利技术公开了一种多物种GC‑MS内源性代谢物数据库的建立方法,包括:1)将多物种样本衍生化后的GCMS数据基于NIST库搜库,保留打分在700以上的物质作为筛选出的高分物质;2)提取步骤1)筛选出的高分物质的质谱信息,建立高分NIST库;3)将高分NIST库中带衍生化基团的名称翻译并替换成衍生化之前的名称,得到高分库;4)将高分库与扩增后的背景噪音库和扩增后的标准品数据库合并,得到多物种GC‑MS内源性代谢物数据库。本发明专利技术提供的数据库既可以满足植物、动物及微生物等多类型生物样本的检索需求,又能更加准确的定性到更多的代谢物。

【技术实现步骤摘要】
一种多物种GC-MS内源性代谢物数据库及其建立方法
本专利技术属于生物数据库领域,尤其涉及一种多物种GC-MS内源性代谢物数据库及其建立方法。
技术介绍
GCMS技术作为目前在代谢组学研究中最常用的分析手段之一,通常用来分析一些挥发性强的小分子代谢物,对于一些像氨基酸、糖醇类、有机酸、生物胺及有机磷酸盐等分子量较小、极性较大的代谢物则需要通过衍生化(硅烷化或者酯化等)的方式降低其沸点、增加其热稳定性才能通过GCMS分析。而在GCMS分析过程中,最重要的一步则是对代谢物进行定性分析,定性的准确性和数量取决于数据库。目前,GCMS常用的数据库有NIST库、Fiehn库等。NIST标准质谱数据库是由美国国家标准技术研究院(NIST)(NationalInstituteofStandardsandTechnology)出版,现在,基于EI源的NIST库已经更新到NISTv17,搜库软件(NISTMSSearch)的版本也更新到2.3。其中,主库mainlab中已经包含了267376种化合物的质谱图信息,因此NIST库是一个非常大的数据库,正因为本文档来自技高网...

【技术保护点】
1.一种多物种GC-MS内源性代谢物数据库的建立方法,包括:/n1)将多物种样本衍生化后的GCMS数据基于NIST库搜库,保留打分在700以上的物质作为筛选出的高分物质;/n2)提取步骤1)筛选出的高分物质的质谱信息,建立高分NIST库;/n3)将高分NIST库中带衍生化基团的名称翻译并替换成衍生化之前的名称,得到高分库;/n4)将高分库与扩增后的背景噪音库和扩增后的标准品数据库合并,得到多物种GC-MS内源性代谢物数据库。/n

【技术特征摘要】
20200228 CN 20201012902191.一种多物种GC-MS内源性代谢物数据库的建立方法,包括:
1)将多物种样本衍生化后的GCMS数据基于NIST库搜库,保留打分在700以上的物质作为筛选出的高分物质;
2)提取步骤1)筛选出的高分物质的质谱信息,建立高分NIST库;
3)将高分NIST库中带衍生化基团的名称翻译并替换成衍生化之前的名称,得到高分库;
4)将高分库与扩增后的背景噪音库和扩增后的标准品数据库合并,得到多物种GC-MS内源性代谢物数据库。


2.根据权利要求1所述的一种多物种GC-MS内源性代谢物数据库的建立方法,其特征在于,步骤2)中,采用基于Python编写的筛选脚本匹配筛选出的高分物质并提取质谱信息。


3.根据权利要求1所述的一种多物种GC-MS内源性代谢物数据库的建立方法,其特征在于,步骤3)中带衍生化基团的名称及翻译的形式包括:
形式①:Name,nTMS(derivative)/n(trimethylsilyl)ether,其中Name为物质衍生化前的名称,n为表征衍生化基团个数的数字或者文字,TMSderivative/(trimethylsilyl)ether为衍生化基团,翻译时去掉“,nTMSderivative/(trimethylsilyl)ether”保留Name即为翻译后名称;
形式②:Name,ntrimethylsilylether,(O)-methyloxime(),其中Name为物质衍生化前的名称,n为衍生化基团的个数,trimethylsilylether为衍生化基团三甲基硅烷酯,methyloxime()为发生肟...

【专利技术属性】
技术研发人员:胡哲尹小羚彭章哓陆嘉伟胡绪俊舒烈波
申请(专利权)人:上海鹿明生物科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1