一种预测药物的蛋白质相互作用靶点的方法和系统技术方案

技术编号:12524127 阅读:145 留言:0更新日期:2015-12-17 13:30
本发明专利技术涉及一种预测药物的蛋白质相互作用靶点的方法和系统。该方法包括:1)收集人类蛋白质相互作用网络和药物的单个蛋白质靶点数据,构建药物的相互作用蛋白质靶点数据集;2)获取药物和蛋白质的描述数据;3)构建二部图表征药物和蛋白质对的相互作用关系,构建表征药物相似性和蛋白质对相似性的相似矩阵,建立核函数联系药物和蛋白质对的相似矩阵,通过机器学习算法建立预测模型;4)利用未知的药物和相互作用蛋白质对进行独立集测试,预测可能存在的未知的药物蛋白质相互作用靶点;进而通过数据库和文献检索对预测结果进行验证。本发明专利技术可以拓广药物靶点的搜索空间,能够得到分类性能最好、更为特异的药物蛋白质相互作用靶点。

【技术实现步骤摘要】

本专利技术属于生物技术和信息技术
,具体涉及一种预测药物的蛋白质相互 作用靶点的方法和系统。
技术介绍
系统生物学强调生物分子的协同作用在决定系统层面表型中的重要作用,在此 观念的驱动下产生了海量的相互作用数据。一个典型例子是通过酵母双杂交实验和质谱 实验生成的蛋白质相互作用数据。相互作用的蛋白质复合物被认为是活体细胞生物过程 的主要实施者,功能大于单个蛋白质的简单加和,它们是药物进入活体细胞后作用的主 要单元。相对于作用单个蛋白质,药物作用到相互作用的蛋白质复合物会产生更少的副 作用而且可以极大地拓宽药物革E点的搜索空间(参考文献Klussmann, E. and Scott, J. (2008)Protein-Protein Interactions as New Drug Targets. Springer-Verlag Berlin Heidelberg.)。这些事实使得药物的蛋白质相互作用靶点预测无论在学术领域还是在药物 制造工业领域都受到广泛关注。 利用生物实验方法寻找药物的蛋白质相互作用靶点是很困难的,因为蛋白质 相互作用具有动态性,随着细胞类型和时间而变化。此外相互作用蛋白质复合物与药 物作用的结合位点也是很难检测的(参考文献Valkov E,Sharpe T,Marsh M, Greive S, Hyvoncn Μ. (2012)Targeting protein-protein interactions and fragment-based drug discovery. Topics in Current Chemistry, 317, 145 - 179)。所以研究人员开发了 若干计算方法预测药物的蛋白质相互作用靶点,这为接下来的生物实验提供更为可靠的 实验候选集(参看文献 Neugebauer A, Hartmann R W, Klein C D. (2007) Prediction of protein-protein interaction inhibitors by chemoinformatics and machine learning methods.Journal of medicinal chemistry, 50(19):4665-4668. Voet A, Banwell E F, Sahu K K, et al. (2013)Protein interface pharmacophore mapping tools for small molecule protein:protein interaction inhibitor discovery. Current topics in medicinal chemistry, 13(9):989-1001.)。 预测药物蛋白质相互作用靶点最初的想法是试图找到那些结构特异的蛋白 质相互作用复合物,以及那些可以和该复合物结合的具有特殊结构的小分子。为此, 研究人员通过研究实验证实的药物蛋白质相互作用靶点,归纳总结可作用到蛋白质相 互作用复合物的药物的结构特征。基于这些共性的特征,可以从大量的化学分子中筛 选出具有特殊结构的化合物,这些化合物可以特异性地作用到蛋白质相互作用复合物 上,成为潜在的药物祀点(参考文献Christelle Reynfes, H6l6ne Host, Anne-Claude Camproux, Guillaume Laconde, Florence Leroux, Anne Mazars, Benoit Deprez, Robin Fahraeus, Bruno 0. Villoutreix, and Olivier Sperandiol. (2010)Designing focused chemical libraries enriched in protein-protein interaction inhibitors using machine-learning methods. PLoS computationalbiology, 6(3):e100 0695.) 〇 与此同 时,研究人员还依据他们的发现构建了使用方便的数据库,用以存储那些具有特殊分子 结构的化合物以及和它们作用的蛋白质相互作用复合物(参考文献Labb6CM,Laconde G, Kuenemann MA, Villoutreix BO, Sperandio 0. (2013)iPPI-DB:a manually curated and interactive database of small non-peptide inhibitors of protein-protein interactions. Drug Discovery Today, 18, 958 - 968. Basse M J,Betzi S,Bourgeas R,et al. (2013)2P2Idb:a structural database dedicated to orthosteric modulation of protein - protein interactions. Nucleic acids research,2013, 41 (Dl):D824_D827.)〇 但这些研究集中于个例研究,实验费用昂贵且费时费力。 为了寻找可以和蛋白质复合物结合的小分子,研究人员开发了基于蛋白质序 列片段的计算方法。这种方法认为药物和蛋白质复合物的结合主要发生在蛋白质复合 物的结合表面上的一些高度保守的氨基酸位点上。因此可以通过分析蛋白质复合物结 合表面的结构,寻找那些可以和该结构匹配的小分子,由此确定与其结合的化合物分 子(参考文献 Valkov E,Sharpe T,Marsh M,Greive S, HyvfmenM. (2012) Targeting protein-protein interactions and fragment-based drug discovery. Topics in Current Chemistry, 317, 145 - 179)。该方法需要已知蛋白质复合物的结构,然而事实上, 只有少部分蛋白质的结构是已知的,因此基于蛋白质序列片段的方法只适用于小规模研 究。 随着高通量生物实验的发展,许多模式生物的蛋白质相互作用网络已知,包 括大肠杆菌、酵母、线虫、果绳和人(参考文献Butland G,Peregrin-Alvarez J M,Li J, et al. (2005)Interaction network containing conserved and essential protein complexes in Escherichia coli. Nature, 433(7025):531-537. Gavin A C, Bosche M,Krause R, et al. (2002)Functional organization of the yeast proteome by systematic analysis of protein complex本文档来自技高网...

【技术保护点】
一种预测药物的蛋白质相互作用靶点的方法,其特征在于,包括如下步骤:1)收集人类蛋白质相互作用网络和药物的单个蛋白质靶点数据,构建药物的相互作用蛋白质靶点数据集;2)获取药物和蛋白质的描述数据;3)构建二部图表征药物和蛋白质对的相互作用关系,利用药物和蛋白质的描述数据分别构建表征药物相似性和蛋白质对相似性的相似矩阵,然后建立核函数联系药物和蛋白质对的相似矩阵,并通过机器学习算法建立预测药物的蛋白质相互作用靶点的预测模型;4)利用未知的药物和相互作用蛋白质对进行独立集测试,预测可能存在的未知的药物蛋白质相互作用靶点。

【技术特征摘要】

【专利技术属性】
技术研发人员:王永翠王勇
申请(专利权)人:中国科学院数学与系统科学研究院中国科学院西北高原生物研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1