一种药物活性的预测方法及其应用技术

技术编号:23155571 阅读:28 留言:0更新日期:2020-01-21 20:39
本发明专利技术公开了一种药物活性的预测方法及其应用。本发明专利技术所述药物活性的预测方法包括以下步骤:1)通过查询药物靶标互作关系数据库信息,收集人类上市或者在研药物的靶标及其治疗活性信息;2)查找多个致病基因数据库,收集疾病关联基因,根据疾病关联基因的对应药物的有活性率,给予不同数据库来源的疾病关联基因不同的赋分;3)构建药物靶标与疾病关联基因的特征属性;4)构建机器学习预测模型;5)对模型预测效果进行评估;6)预测针对特定疾病有活性的药物。本发明专利技术提供的药物活性的预测方法能够作为药物发现领域的GPS,高效识别疾病关联基因,为活性药物的预测研发提供有效指导,并为未来药物发现领域提供全新的方法和思路。

【技术实现步骤摘要】
一种药物活性的预测方法及其应用
本专利技术属于生物医药
,尤其涉及一种药物活性的预测方法及其应用。
技术介绍
药物研究与开发是一项周期长、耗资大、风险高、竞争激烈、利润高的系统工程。据统计,一个新药从概念产生、实验室先导化合物的确定、优化、临床试验到最终上市,需要花费10-15年时间,研发费用高达8亿美元以上(DiMasi,J.A.,Hansen,R.W.,andGrabowski,H.G.(2003).Thepriceofinnovation:newestimatesofdrugdevelopmentcosts.J.HealthEcon.22:151-185.),并且这个费用仍在逐年增长,根据塔夫茨药物研发中心(TuftsCenterfortheStudyofDrugDevelopment,CSDD)2014年的报告,这个数字现在已经增长到了25.58亿美元(http://csdd.tufts.edu/news/complete_story/pr_tufts_csdd_2014_cost_study)。然而,如此巨大的投资并没有获得预期的回报。1996年FDA批准上市的新分子药物为53个,2007年的这一数值仅为15,创历史新低(Hughes,B.(2008).2007FDAdrugapprovals:ayearofflux.Nat.Rev.DrugDiscov.7:107-109;Editorial.(2008).Raisingthegame.Nat.Biotech.26:137.)。在针对神经性疾病等复杂疾病的新药研发方面,所遇到的困难比过去更大、失败率更高(白东鲁;沈竞康.(2014).新药研发案例研究:明星药物如何从实验室走向市场.北京:化学工业出版社.)。可以说药物设计和开发面临着前所未有的“高投入、低产出”的艰难境地。从化学角度来看,药物发挥治疗作用是通过抑制或激活疾病相关的一个或多个靶基因/蛋白来实现的。因此,基因-疾病相关信息对于药物发现是至关重要的。在生命科学中,重点揭示基因-疾病联系的遗传学,为制药工业做出了巨大贡献(kada,Y.,etal.(2014).Geneticsofrheumatoidarthritiscontributestobiologyanddrugdiscovery.Nature.506:376-381.)。2015年,Matthew等人在遗传学研究领域顶级杂志《NatureGenetics》中指出遗传致病基因研究有利于提高药物研发效率,作者将临床前(Preclinical)、1~3期临床(PhaseI~III)和批准的(Approved)药物信息,与基因的风险性疾病相关信息(复杂疾病相关变异数据库GWASdb和孟德尔遗传病相关的数据库OMIM)相互比较,结果发现药物靶标与待治疗疾病之间有遗传证据支持的比例从2.0%上升到8.2%(Matthew,N.(2015).Thesupportofhumangeneticevidenceforapproveddrugindications.NatGenet.47(8):856-860.)。因此,我们可以充分利用化学结合遗传学方法,挖掘药物靶标基因与遗传疾病的关联信息,从而提高药物研发的成功率。然而,以前几乎所有的研究都认为疾病的发生是由于某个单一基因位点的变化,近些年人们才逐渐认识到大多数疾病是由多种致病基因引起的(Hopkins,A.L.(2008).Networkpharmacology:thenextparadigmin,drugdiscovery.Nat.Chem.Biol.4:682-690.),而当前已被证实的疾病与单基因变异之间的联系还不足以指导新药研发。鉴于此,我们推测,针对特定疾病相关的多个基因进行遗传信息分析,比针对单个致病基因的研究能够更有效地识别潜在药物,指导活性药物研究开发。基于这一猜想,我们开发了一种针对多基因的新方法来预测药物活性。
技术实现思路
本专利技术的目的在于克服现有药物筛选技术的缺陷而提供一种药物活性的预测方法及其应用,本专利技术的药物活性的预测方法能够针对特定疾病的多个疾病关联基因进行药物开发,具有成本低、效率高、结果精准等优点。本专利技术采用的技术方案为:一种药物活性的预测方法,包括以下步骤:(1)通过查询药物靶标互作关系数据库信息,收集人类上市或者在研药物的靶标及其治疗活性信息;(2)查找多个致病基因数据库,收集疾病关联基因,根据疾病关联基因的对应药物的有活性率,给予不同数据库来源的疾病关联基因不同的赋分,来自不同数据库的同一疾病关联基因的得分相加即为该疾病关联基因的疾病相关性得分;(3)基于步骤(1)中药物靶标及其活性信息和步骤(2)中疾病关联基因的得分构建药物靶标与疾病关联基因的特征属性,所述特征属性包括药物靶标内疾病关联基因总分、药物靶标内疾病关联基因平均分、疾病强相关基因数量以及疾病强相关基因占药物靶标总数的比例;(4)构建机器学习预测模型;(5)对步骤(4)中的模型预测效果进行评估;(6)预测针对特定疾病有活性的药物。本技术方案中根据疾病关联基因的对应药物的有活性率,给予不同数据库来源的疾病关联基因不同的赋分,能够高效识别与特定疾病有强相关性的多个致病基因,得分越高,则认为该致病基因与对应疾病的相关性越强,能够针对特定疾病的多个疾病关联致病基因进行活性药物开发,从而提高药物开发成功率,具有成本低、效率高、结果精准等优点。作为本专利技术所述药物活性的预测方法的优选实施方式,所述赋分是指根据统计不同来源数据库疾病关联基因的对应药物的有活性率,对相关数据库进行排序,根据排序结果分别给予不同数据库来源的疾病关联基因不同的赋分,并将来源于多个数据库的同一疾病关联基因的赋分进行累加,即:其中,Druggabilityscore是指来源于多个数据库的同一疾病关联基因的得分,scoreij是指疾病关联基因i在第j个数据库中的得分;i=1,2,...,m;j=1,2,...,k,m是指疾病关联基因的数量,k是指数据库的数量;得分越高,则认为该致病基因与对应疾病的相关性越强。本技术方案中对疾病关联基因进行赋分的方法,能够高效识别与特定疾病有强相关性的多个致病基因,并针对特定疾病的基于多个疾病关联致病基因进行活性药物开发,从而提高药物开发成功率。作为本专利技术所述药物活性的预测方法的优选实施方式,所述人类上市或者在研药物的靶标信息是从DGIdb、DrugBank和TTD数据库中获得;所述上市或者在研药物的治疗活性信息是从DrugBank、TTD和ClinicalTrials数据库中获得。作为本专利技术所述药物活性的预测方法的优选实施方式,所述步骤(2)中的致病基因数据库包含GAD、OMIM、Clinvar、Orphanet、DisGeNET、INTREPID、GWASdb和HGMD。作为本专利技术所述药物活性的预测方法的优选实施方式,所述评估模型预测效果的评价指标包括AUC、ACC、MCC、模型的本文档来自技高网
...

【技术保护点】
1.一种非治疗目的的药物活性的预测方法,其特征在于,包括以下步骤:/n(1)通过查询药物靶标互作关系数据库信息,收集人类上市或者在研药物的靶标及其治疗活性信息;/n(2)查找多个致病基因数据库,收集疾病关联基因,根据疾病关联基因的对应药物的有活性率,给予不同数据库来源的疾病关联基因不同的赋分,来自不同数据库的同一疾病关联基因的得分相加即为该疾病关联基因的疾病相关性得分,其中,所述致病基因数据库包含GAD、OMIM、Clinvar、Orphanet、DisGeNET、INTREPID、GWASdb和HGMD;/n其中,所述赋分是指根据统计不同来源数据库疾病关联基因的对应药物的有活性率,对致病基因数据库进行排序,根据排序结果分别给予不同数据库来源的疾病关联基因不同的赋分,任一数据库来源的疾病关联基因的赋分与该数据库的排序位次一致,数据库疾病关联基因的对应药物的有活性率越高,则该数据库来源的疾病关联基因的赋分越高,并将来源于多个数据库的同一疾病关联基因的赋分进行累加;/n(3)基于步骤(1)中药物靶标及其活性信息和步骤(2)中疾病关联基因的得分构建药物靶标与疾病关联基因的特征属性,所述特征属性包括药物靶标内疾病关联基因总分、药物靶标内疾病关联基因平均分、疾病强相关基因数量以及疾病强相关基因占药物靶标总数的比例;/n(4)构建机器学习预测模型;/n(5)对步骤(4)中的模型预测效果进行评估;/n(6)预测针对特定疾病有活性的药物。/n...

【技术特征摘要】
1.一种非治疗目的的药物活性的预测方法,其特征在于,包括以下步骤:
(1)通过查询药物靶标互作关系数据库信息,收集人类上市或者在研药物的靶标及其治疗活性信息;
(2)查找多个致病基因数据库,收集疾病关联基因,根据疾病关联基因的对应药物的有活性率,给予不同数据库来源的疾病关联基因不同的赋分,来自不同数据库的同一疾病关联基因的得分相加即为该疾病关联基因的疾病相关性得分,其中,所述致病基因数据库包含GAD、OMIM、Clinvar、Orphanet、DisGeNET、INTREPID、GWASdb和HGMD;
其中,所述赋分是指根据统计不同来源数据库疾病关联基因的对应药物的有活性率,对致病基因数据库进行排序,根据排序结果分别给予不同数据库来源的疾病关联基因不同的赋分,任一数据库来源的疾病关联基因的赋分与该数据库的排序位次一致,数据库疾病关联基因的对应药物的有活性率越高,则该数据库来源的疾病关联基因的赋分越高,并将来源于多个数据库的同一疾病关联基因的赋分进行累加;
(3)基于步骤(1)中药物靶标及其活性信息和步骤(2)中疾病关联基因的得分构建药物靶标与疾病关联基因的特征属性,所述特征属性包括药物靶标内疾病关联基因总分、药物靶标内疾病关联基因平均分、疾病强相关基因数量以及疾病强相关基因占药物靶标总数的比例;
(4)构建机器学习预...

【专利技术属性】
技术研发人员:张红雨全源朱丽达李姜柳叶茂杨庆勇黄清
申请(专利权)人:武汉百药联科科技有限公司华中农业大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1