基于分层原子加和模型的分子酸碱解离常数的预测方法技术

技术编号:2915363 阅读:390 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种全新的基于分层原子加和模型的有机小分子酸碱解离常数(pK↓[a])的预测方法。基于在给定温度下酸碱解离平衡的自由能变化的线性关系规律,该方法首先以Hammett-Taft方程和Cherkasov等人提出的“解离中心-其余部分”的处理取代基效应建立一种分层的原子加和模型,然后通过该模型由化合物具体结构计算相应化合物的酸碱解离常数pK↓[a]值。该方法不存在常规方法涉及大量取代基电子效应常数及校正因子的困难,同时保证了预测的快速、准确,对多个样本集表现出良好的数据拟合和预测能力,打破传统的在新药研发的早期对药物pK↓[a]进行研究,大规模降低了药物研发成本,提高了新药发现效率。

【技术实现步骤摘要】

本专利技术涉及一种新型的基于分层的原子加和模型的分子酸碱解离常数预测方法,适用于根据化合物分子结构信息对该化合物进行虚拟体外高通量吸收、分布、代谢、排泄等(ADME)性质的评价和筛选。
技术介绍
传统的药物设计往往首先关注化合物的活性(一般为体内活性),然后才是化合物的药代动力学特征(图1)。但随着活性化合物发现能力的不断增强以及ADME研究的不断深入,这种传统的、效率低下的串行药物开发流程已经不能适应现代的药物开发需要。取而代之的更具效率的并行化药物开发流程(图1)。在并行化流程中,药物的多种性质同步优化,这就可以大大加速药物开发的效率。但是这种并行化流程在现在多数情况下仍是一个理论上的概念,主要原因是建立高通量药代动力学筛选模型的难度较大。细胞层次的研究经过多年的发展,已经建立了一些高通量的体外ADME研究方法,比如测定肠吸收的细胞单层转运试验、基于肝细胞或提取肝微粒体的新陈代谢和药物-药物相互作用试验、基于肝细胞或其他组织细胞的生长抑制为指标的细胞毒性试验等。但是到目前为止,高通量筛选还仅仅局限于少数几种药代动力学性质。在试验实现高通量筛选存在困难的情况下,发展有效的药代动力学特征理论预测及高通量虚拟筛选模型具有非常重要的意义。-->药物分子的酸碱解离常数(pKa)是显著影响药物生物利用度的性质。任何药物在起作用之前一般至少会通过被动扩散或主动转运跨生物膜一次,根据给药途径和作用靶标的位置差异,药物介入的溶液环境会有明显不同。对酸性或碱性药物来说,分布和扩散很大程度依赖于环境pH值下该药物分子的解离程度。类似的,受解离程度影响的药物分子的静电性质和氢键形成性能,药物分子与结合位点或主动转运载体之间的亲和性(结合自由能)也与环境pH值下的分子解离程度有很重要的关系。另外,辛醇/水分配系数(P,logP)是决定肠吸收和药物可利用度的重要属性之一。然而logP是指分子中性状态下的脂水分配比例,对于酸或碱因为其分配依赖于水相的pH值,必须考虑其解离状态。这种pH依赖的分布系数(D,logD)是P和pKa的函数。对于最简单的一元酸来说:log D=logP-log(1+Ka/[H+])≈logP-(pH-pKa)     (eq.1)在实际应用中,logD是比logP更重要的评价指标,而其依赖于pKa的计算。因此,pKa是早期药物设计和筛选,尤其是用于指导化合物定购和合成的一项重要ADME性质相关指标。到目前为止已经有一些模型和方法可以对pKa提供不同精度的预测,这些模型基本可以分为以下三种:1)量化模型;2)半经验模型;3)基于化学信息学的模型。-->大部分pKa经验模型是基于线性自由能关系的,即可用著名的Hammett和Taft方程描述如下:pKa=pKa0-ρΣσ---(eq.2)]]>pKa=pKa0-ρ*Σσ*---(eq.3)]]>在给定温度下,酸碱解离平衡的自由能变化遵循线性关系,插入一个取代基将会引起的自由能变化ΔG和相应的pKa变化。因此,对于指定分子的pKa可以通过已知分子的pKa0和量化与其相关的取代基效应(如识别特征性碎片)来进行预测。基于碎片的方法在定量构效关系(Quantitative Structure-ActivityRelationship,QSAR)研究中的重要性正在得到越来越广泛得认识,在许多商业程序中也使用基于碎片的方法进行pKa的预测,如PALLAS/PKALC(CompuDrug Chemistry Ltd.)和ACD/pKa-DB(Advanced Chemistry Development Inc.)。但是如前文提到的,基于碎片方法的计算很大程度上取决于预先定义的碎片常数库的大小,另外通常只能处理有公共结构的同系物,扩展性有限。根据某一基团的解离程度取决于相邻的原子和键所定义的子环境这一假设,Xing等人提出了一种2D树型分子指纹的方法进行pKa预测。在该模型中,每个解离中心以一个由出现频率和在解离中心周围每个原子和基团类型的位置所组成的计数矢量所表征。这种方法只定义了少数几个简单的基团,更类似于原子加和方法:同种原子或基团类型的贡献根据其距离解离中心的不同而不同,从而避免了直接使用大量的预定义碎片值。但是,这种方法事实上并没有降低模型复杂度,-->最终的取代基效应也只考虑了距解离中心五个连接键的原子和碎片贡献,计算精度较差。Cherkasov等人提出一种非碎片3D方法量化取代基效应来进行pKa预测。该方法的理论基础主要来自于Taft方程(eq.3)和诱导效应“通过空间传递”的假设。预定义参数不完全的问题通过采用原子分类和“解离中心-其余部分”的思路进行解决,提高了模型预测的可扩展性。然而由于计算需要分子的3D结构信息,而在模建过程中没有考虑分子柔性和多重构象问题,该模型仍有待进一步改进。新药研发过程费用昂贵、时间冗长、淘汰率高。平均一个新药的研发需要花费10亿美元以上,耗时约12年时间。大约有90%的候选药物在临床期间被淘汰,这是研发过程费用昂贵的主要因素。候选药物淘汰的原因中很大一部分是药物动力学方面引起的,例如口服吸收性差,生物利用度低。传统的新药研发流程中,药物动力学的研究处于研发的中后期。然而,如果在药物研发的早期对药物动力学进行研究,以尽早淘汰药代动力学参数不理想的候选药物,可以大规模降低药物研发成本,提高新药发现效率。计算机模拟药物动力学正在为全球各大制药公司应用,并将会在药物的研发过程中起到越来越重要的作用。
技术实现思路
本专利技术的目的主要是提供一种适合高通量筛选,同时预测准确、适用范围广泛的有机分子酸碱解离常数评价方法。该目的主要是通过采用一种新型的基于分层原子加和模型和遗传算法的参数估计方法,对现有分子结构和相关pKa数据进行训练而达到-->的。在本专利技术中,我们首先基于Hammett-Taft方程和Cherkasov等人提出的“解离中心-其余部分”的处理取代基效应的思路,建立一种分层的原子加和模型。其中任一原子对给定解离中心的电子效应贡献可以认为是该原子的原子类型及其与解离中心的距离决定的。我们定义这种效应贡献为该原子的内在电子效应常数(σ)和其所处的位置的电子效应传递性能(T)的函数:pKa=pKa0-ρΣ(σT)---(eq.4)]]>与Hammett-Taft方程相同,pKa0是参考化合物的解离常数值,ρ是解离中心依赖的参数,反映了不同解离中心对取代基效应的敏感性差异。为了描述T,我们还需要建立一套分子结构框架来表征原子所处的位置。这里,我们对每个分子都构建了如图2所示的以酸碱解离中心为根的分子连接树。分支的层数和原子编号分别记做i和j,则位置(i,j)表示处于第i层的第j个原子。然后引入描述符γ表示每个原子类型的电子效应传递能力。根据电子效应“通过键传递”的假设(键的连续极化),我们提出下面的电子效应传递性公式用于T的计算:Ti,j=ΣkpathesΠl=1i-1γi,j,k,l---(eq.5)]]>其中k表示给定位置(i,j)到解离中心(根)的第k条通路,l表示通路上每个原子的层编号。这本文档来自技高网
...

【技术保护点】
一种基于分层的原子加和模型预测化合物分子酸碱解离常数的方法,其特征在于,包括如下步骤: a)根据待测化合物的结构确定分子的解离中心,并根据其类型确定其参考化合物解离常数pK↓[a]↑[0],建立以解离中心为根的分子连接树; b) 根据分子中任一原子的类型和所处位置确定该原子的内在电子效应常数σ和电子效应传递性能γ; c)根据下式计算该化合物的酸碱解离常数pK↓[a]: pK↓[a]=pK↓[a]↑[0]-**(σ↓[i,j]**γ↓[i,j,k,l])   (eq.6) 其中,k表示给定原子位置(i,j)到解离中心的第k条通路,l表示第k条通路上原子的层编号,给定原子位置(i,j)表示原子处于第i层的第j个原子,pK↓[a]为酸碱解离常数,pK↓[a]↑[0]为参考化合物解离常数。

【技术特征摘要】
1、一种基于分层的原子加和模型预测化合物分子酸碱解离常数的方法,其特征在于,包括如下步骤:a)根据待测化合物的结构确定分子的解离中心,并根据其类型确定其参考化合物解离常数pKa0,建立以解离中心为根的分子连接树;b)根据分子中任一原子的类型和所处位置确定该原子的内在电子效应常数σ和电子效应传递性能γ;c)根据下式计算该化合物的酸碱解离常数pKa:pKa=pKa0-ΣilevelsΣi,jatoms(σi,jΣi,j,kpathesΠl=1i-1γi,j,k,l)---(eq.6)]]>其中,k表示给定原子位置(i,j)到解离中心的第k条通路,l表示第k条通路上原子的层编号,给定原子位置(i,j)表示原子处于第i层的第j个原子,pKa为酸碱解离常数,pKa0为参考化合物解离常数。2、根据权利要求1所述的分子酸碱解离常数预测方法,其特征在于步骤a参考化合物解离常数pKa0通过如下途径确定:作为取样标准,选择25℃,水溶液中测得1300个化合物的pKa实验值,数据样本来自于Lange′s Handbook of Chemistry,其中选取最常见的41种解离中心,其pKa0值由其对应的最简单的有机分子确定,并使用SMARTS格式描述该解离中心,由此构建得到解离中心参数表,再根据待测化合物结构与解离中心表对比即可确定参考化合物解离常数pKa0。3、根据权利要求1所述的分子酸碱解离常数预测方法,其特征在于上述步骤b中对于每种原子类型定义两个变量σ和γ,分别表征该原子对解离中心的内在电子效应贡献和电子效应传递性能,进行该原子对解离中心的内在电子效应贡献和该原子的电子效应传递性能计算,得到内在电子效应常数参数表和电子...

【专利技术属性】
技术研发人员:蒋华良罗小民朱维良陈凯先郑明月
申请(专利权)人:中国科学院上海药物研究所
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1