一种高通量中药及其代谢产物数据库LutMet-TCM建立的方法和应用技术

技术编号:37666944 阅读:19 留言:0更新日期:2023-05-26 04:26
本发明专利技术公开了一种中药代谢物数据库的建立方法,包括:1)基于中药标准品及保留时间校正内标组建立的的包含保留时间、一级质谱信息、二级质谱信息的LC

【技术实现步骤摘要】
一种高通量中药及其代谢产物数据库LutMet

TCM建立的方法和应用


[0001]本专利技术属于数据库建立
,涉及一种高通量中药及其代谢产物数据库LutMet

TCM建立的方法和应用。

技术介绍

[0002]对中药代谢物的鉴定通常包括推断性鉴定和验证性鉴定,初步推断性鉴定是利用中药代谢物的一种或几种分子性质对其进行鉴定,而验证性鉴定则需要将这些性质与可靠的标准品相比较。实验测定的精确质量和质谱图常用于代谢物鉴定。目前研究中药代谢物的技术平台主要是核磁共振技术和质谱及其联用技术。质谱具有选择性高、检测限低等优点,同时与气相、液相、毛细管电泳等色谱分离技术有良好的兼容性,是代谢产物鉴定的理想工具,辅以功能强大的生物信息学工具以实现对数据的自动化分析。使代谢物的鉴别更为方便可行。
[0003]目前,中药天然产物研究常用的数据库有:TCM@Taiwan、CEMTDD、CHDD、ETCM、TM

MC、TCMID以及YaTCM等。每个数据库收录的化合物数据量较大,在中草药、方剂及其成分分析过程中提供帮助。但这些数据库中天然产物的结构信息、质谱图等信息不完整而且并不是全部可公开获取到,这对于天然产物的研究具有一定的局限性。代谢途径常用的数据库有KEGG数据库,BioCyc数据库,Reactome数据库等,这些数据库功能范围较为广泛,涉及到基因组测序,基因组代谢以及代谢通路分析,而在关于中药代谢注释过程方面的数据库少之又少。目前对于中药代谢产物的研究数据还是来源于文献报道,中药代谢数据库的缺乏减慢了中药代谢的研究进展。

技术实现思路

[0004]为了解决现有技术的不足,针对现有中药代谢数据库的现状和局限性,本专利技术提供了一种中药代谢物数据库的建立方法,通过多种编程语言结合人工校正及标准品数据库验证的多种方式专利技术了一种天然产物种类多,代谢产物信息详细,且能快速,高效,准确分析中药代谢产物的自建数据库,该数据库可以服务于中药复方原型成分的鉴定、入血成分分析以及其他代谢产物鉴定的中药代谢服务。
[0005]本专利技术提供一种中药代谢物数据库的建立方法,包括:
[0006]步骤1),基于中药标准品及保留时间校正内标组建立的包含保留时间、一级质谱信息、二级质谱信息的LC

MS中药标准品高分辨质谱数据库;
[0007]步骤2),体外孵育实验得到中药标准品的I,II相代谢产物样本,提取代谢产物的质谱信息;
[0008]步骤3),基于步骤1)LC

MS中药标准品高分辨质谱数据库并根据代谢规则、反应类型库、反应位点库和打分注释到标准品的体外代谢过程,将代谢产物信息汇总形成代谢产物数据库;
[0009]步骤4),将中药标准品数据库与代谢产物数据库合并,得到中药代谢物数据库LutMet

TCM。
[0010]本专利技术提供的数据库可以满足中药复方原型成分、入血成分以及代谢产物分析鉴定的检索需求。
[0011]步骤1)中药标准品数据库的建立包括:
[0012]①
通过HMDB、文献调研等方式筛选常见且重要的代谢通路及代谢物,所述常见且重要的代谢通路及代谢物包括碳水化合物的代谢、脂质代谢、谷氨酰胺代谢、能量代谢、氨基酸代谢等,在HMDB中主要选取以上代谢通路;初步确定待购买的标准品列表,采购千余种中药标准品,排除每组中因有同分异构体而无法区分色谱峰的因素后,采用每15个中药标准品混为一组的方式上机检测以及用Python编写的脚本快速高效的进行峰识别,峰提取得到中药标准品一级和二级质谱图,同位素峰,不同加和离子峰,保留时间等质谱信息。采用多成分的内标组来校正、减弱质谱仪器在不同批次混标上机时带来的保留时间偏移,该内标组具有线性范围良好、内标成分出峰时间均匀分布在洗脱梯度上、各成分互不干扰等优点,在不同时间进样能够很好的反应仪器状态。
[0013]本专利技术中的标准品,为目前市面上能够买到的、常见的中药成分标准品,库中包含3000+标准品。
[0014]②
人工对脚本提取到的信息进行核对,进一步明确标准品的质谱信息,包括(1)核对不同加和离子的保留时间;(2)核对不同加和离子的二级碎片。
[0015]③
对于一些未知保留时间和质谱信息的化合物通过构建天然产物结构库并借助训练集以及QI软件预测功能对未知保留时间和质谱信息的化合物进行预测,丰富并补充中药标准品数据库。其中,训练集的来源是已上机标准品的信息,包括保留时间,logP值等,通过标准品的一些信息训练成一个模型。
[0016]步骤2)中,通过体外孵育系统模拟人体代谢的生理环境,通过加入酶源和I,II相辅因子触发I,II相代谢反应;氧化反应是在CYP

450酶系、单加氧酶、过氧化物酶的催化下进行的发生失去电子、氧化、脱氢的反应;还原反应是指含有羰基,硝基,偶氮基的化合物经过代谢生成相应的羟基和氨基化合物;水解反应的发生可以直接与酯酶进行水解反应生成相应的醇和酸;结合反应借助辅因子的参与,使化合物在羟基上加上极性大的官能团;代谢样本经过有机试剂沉淀蛋白并高速离心取上清后上机检测。
[0017]步骤3)中代谢产物的注释过程包括:
[0018]①
采用Python编写的脚本快速高效的进行代谢产物峰识别,峰提取,保留时间等;
[0019]②
前期总结不同类别天然产物的反应类型库(氧化,还原,水解,结合反应),根据不同的反应类型将化合物的代谢反应进行分类;
[0020]③
通过查阅大量的文献总结一类化合物代谢反应位点信息及规律(例如:黄酮类化合物在6位和7位上容易发生II相代谢),再根据反应位点库去匹配代谢产物的反应位点信息;
[0021]④
综合以上代谢产物信息输出中药成分的代谢注释过程(反应类型,代谢产物结构,分子式,精确分子量,SMILES,保留时间等)。
[0022]基于以上方法建立的数据库,本专利技术还提出了一种高通量中药及其代谢产物数据库在中药复方原型成分、入血成分以及代谢产物分析鉴定中的应用。
[0023]与现有技术相比,本专利技术的有益效果是:
[0024]本专利技术建立的中药代谢数据库中包含了3600种中药标准品和15000种中药代谢产物及其保留时间、一级质谱和二级质谱信息。并且还在不断的更新中,其质荷比范围在85到1200之间,覆盖了包括黄酮类,香豆素类,萜类,有机酸类,苯丙素类,生物碱类,木质素类,强心苷类等多种类型的中药天然产物及其代谢物。
[0025]中药代谢数据库中的代谢物具有多种基质,反应体系与动物源的相同,且反应较为稳定,该数据库通过了3000余种标准品验证,人工核对和QI软件预测使得改数据库满足植物源和动物源不同样本基质高准确性的定性分析。本数据库的代谢物信息更全面,检索速度较快,为中药的代谢研究提供帮助,提高了中药代谢分析的效率。
附图说明
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高通量中药及其代谢产物数据库LutMet

TCM建立的方法,其特征在于,包括以下步骤:步骤1,基于中药标准品及保留时间校正内标组建立包含保留时间、一级质谱信息、二级质谱信息的LC

MS中药标准品高分辨质谱数据库;步骤2,通过体外孵育得到中药标准品的I,II相代谢产物样本,提取代谢产物的质谱信息;步骤3,基于所述LC

MS中药标准品高分辨质谱数据库并根据代谢规则、反应类型库、反应位点库和打分注释到标准品的体外代谢过程,将代谢产物信息汇总形成代谢产物数据库;步骤4,将所述LC

MS中药标准品高分辨质谱数据库与所述代谢产物数据库合并,得到中药代谢物数据库LutMet

TCM。2.如权利要求1所述的高通量中药及其代谢产物数据库LutMet

TCM建立的方法,其特征在于,所述LC

MS中药标准品高分辨质谱数据库的建立包括以下子步骤:步骤11,通过HMDB、文献调研方式筛选常见且重要的代谢通路及代谢物,初步确定待购买的标准品列表,采购三千余种中药标准品,在排除每组中因有同分异构体而无法区分色谱峰的因素后,采用每15个中药标准品混为一组的方式上机检测以及用Python编写的脚本进行峰识别,峰提取得到中药标准品一级和二级质谱图,同位素峰,不同加和离子峰,保留时间在内的质谱信息;采用多成分的内标组来校正、减弱质谱仪器在不同批次混标上机时带来的保留时间偏移;步骤12,人工对脚本提取到的信息进行核对,进一步明确标准品的质谱信息;步骤13,对于未知保留时间和质谱信息的化合物通过构建天然产物结构库,并借助训练集以及QI软件预测功能对未知保留时间和质谱信息的化合物进行预测,丰富并补充LC

MS中药标准品高分辨质谱数据库。3.如权利要求2所述的高通量中药及其代谢产物数据库LutMet

TCM建立的方法,其特征在于,所述常见且重要的代谢通路及代谢物包括碳水化合物的代谢、脂质代谢、谷氨酰胺代谢、能量代谢、氨基酸代谢;在HMDB中主要选取以上代谢通路。4.如权利要求2所述的高通量中药及其代谢产物数据库LutMet

TC...

【专利技术属性】
技术研发人员:张甜甜杨孝德张子健胡哲彭章晓付艳蕾舒烈波
申请(专利权)人:上海鹿明生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1