一种计算机辅助虚拟高通量筛选算法制造技术

技术编号:33952302 阅读:41 留言:0更新日期:2022-06-29 22:42
本发明专利技术提供了一种计算机辅助虚拟高通量筛选算法,包括分子重叠和分子评分两部分;数据库中的候选分子的结合态构象是通过直接叠加到参考分子的晶体结构上获得的,参考分子为有晶体结构参数的药物分子,如果存在多个符合条件的药物分子,则选择和蛋白靶标具有最强亲和力的作为参考分子;分子重叠的算法包括:分子碎片重叠法、相似分子重叠法和基于药效团模型的三维重叠法。通过分子重叠算法将候选化合物置于靶蛋白的结合位点后,计算这个新的蛋白质

【技术实现步骤摘要】
一种计算机辅助虚拟高通量筛选算法


[0001]本专利技术涉及生物医药
,尤其涉及药物设计领域,可用于药物筛选。

技术介绍

[0002]众所周知,药物研发投入高、周期长、风险高。目前世界上每种药物从开发到上市平均需要花费15年的时间,耗费超过25亿美元,很大部分是花费在先导药物的筛选和优化的实验上。先导药物的筛选与优化阶段为新药的后期研发提供候选药物,是整个药物研发的关键。传统的药物开发模式周期长、耗费巨大,从上万个化合物中才能发掘出一个有应用价值的新药,这种方法具有很大的随机性和盲目性。因此进入21世纪以后,计算机辅助药物分子筛选因其具有低投入高产出的优势越来越受到重视,正在逐步取代传统的药物开发模式,市场前景十分广阔。
[0003]虚拟筛选是一种从化合物数据库中分离出对靶标有活性的化合物的计算机模拟技术,成为药物筛选的发展趋势。它通常用于作为高通量筛选(HTS)的补充,甚至可以代替HTS。分子对接和评分算法是目前广泛应用的一种虚拟筛选技术,它的特点是能够快速筛选具有上百万个化合物的数据库,但它的算法是建立在极度简化了的模型上,准确度非常低。自由能微扰法,基于量子力学基本原理的算法,以及MM

PBSA法是其他的虚拟筛选方法,他们走到了另外一个极端,偏重于结果的准确度,但运算速度太慢而无法大规模应用。市场迫切需要一种兼顾药物筛选的速度和准确度的一种新算法。

技术实现思路

[0004]本专利技术的目的在于提供一种计算机辅助虚拟高通量筛选算法,以解决上述
技术介绍
中提出的问题
[0005]本专利技术是通过以下技术方案实现的:
[0006]一种计算机辅助虚拟高通量筛选算法,该算法的核心分为分子重叠和分子评分两大部分。
[0007]一、分子重叠
[0008]数据库中的候选分子的结合态构象是通过直接叠加到参考分子的晶体结构上获得的。参考分子为有晶体结构参数的药物分子。如果存在多个符合条件的药物分子,则选择和蛋白靶标具有最强亲和力的作为参考分子。分子重叠的算法包括:分子碎片重叠法、相似分子重叠法和基于药效团模型的三维重叠法,可以依据不同情况采用。
[0009]当靶蛋白具有现有配体时,我们在应用本算法进行虚拟筛选之前先分析现有配体的结合热力学性质。从中我们提取对结合自由能有重大贡献的关键子结构或官能团。然后我们应用该子结构或官能团(即分子碎片)来搜索数据库,发现那些具有相同分子碎片的化合物。对每个新发现的化合物,我们以分子碎片为基准把它重叠到现有配体与靶蛋白的晶体结构中,然后针对该化合物进行能量最小化处理。
[0010]如果现有配体中没有对结合自由能的贡献特别突出的分子碎片,就采用相似分子
重叠法来进行数据库筛选。数据库中的每个化合物都与现有配体进行相似性分析并给化合物的相似性评分,完全一样为1.0,完全不一样为0.0;如果分子整体的相似性大于0.8,则以分子碎片为基本单位,每个分子碎片也赋一个相似性的值,并按照相似性排序;选出相似性最高的3个分子碎片,并依此为基准将化合物重叠到现有配体与靶蛋白的晶体结构中,然后针对该化合物进行能量最小化处理。
[0011]当靶蛋白没有可用的配体时,我们首先根据靶蛋白的结合位点创建一个3

D药效团模型。然后,我们用药效团模型筛选数据库,寻找具有药效团模型特征的化合物。为了提高效率,我们仅在数据库搜索步骤中应用2

D药效团模型,然后在对被选中的化合物评估步骤中应用3

D特征。
[0012]药效团模型生成算法如下:首先将间距为的3D网格应用于目标蛋白的结合位点;然后用氢键供体、氢键受体和疏水基团等三种探针对网格点进行能量评估;然后将被识别为强相互作用点的网格点进行聚集以形成药效团模型的相互作用中心,相互作用中心的数量限制为不超过4个;然后再把数据库中通过2

D筛选的化合物的3

D药效团与依据结合位点的3

D药效团进行重叠,并针对该化合物进行能量最小化处理。
[0013]二、分子评分
[0014]通过分子重叠算法将候选化合物置于靶蛋白的结合位点后,我们要计算这个新的蛋白质

配体分子体系的结合自由能。我们通过定义live set和real set来提高运算的效率。对于蛋白质

配体分子体系,live set—可以自由移动的结合位点蛋白原子的集合—被定义为距离配体的任何原子以内的所有蛋白原子;real set—一组被视为刚性的蛋白质原子—被定义为距离live set内任何原子以内的所有蛋白质残基的原子;所有其他的蛋白质原子在自由能计算中都被忽略掉了,因为它们对配体的亲和作用的贡献可以忽略不计。在自由能计算中距离超过的两个原子间的非键作用力也被忽略不计。本方法采用以下的评分公式来计算结合自由能:
[0015]E=E
el
+E
vdw
+G
gb
+G
np
[0016]ΔE=E
complex

E
protein

E
ligand
[0017]其中E
el
是原子之间的库仑力;E
vdw
是原子之间的范德华力;G
gb
是基于Generalized

Born溶剂化模型计算的体系溶剂化自由能,精度高,评分结果也更加准确;G
np
是溶剂化自由能中的非极性部分,与溶剂接触表面积呈线性关系。我们先使用第一个公式来计算蛋白质

配体复合物的能量E
complex
,然后保持蛋白质和配体的构象不变,把它们分开,分别计算蛋白质的能量E
protein
和配体的能量E
ligand
。最后计算复合物、蛋白质和配体的能量的差值,就得到了该分子体系的结合自由能。
[0018]与现有技术相比,本专利技术的有益效果是:
[0019]本专利技术是有关一种兼顾计算机辅助药物筛选的准确度和速度的一种新算法。与分子对接和评分法相比,它的准确度大幅提高,主要原因在于:(1)候选分子的结合构象是通过直接叠加到参考分子的晶体结构上获得的。它避免了在分子对接的一般实践中尝试数百万个随机构象的做法,直接采用与蛋白质的更准确结合模式。因此,所得的结合构象更加准确。(2)评分函数中的结合能包括溶剂化能,并基于比经验评分函数更稳健的合理物理模型计算得到结合能,即采用的模型更加复杂合理,更接近实际情况。同时,它的运行速度也与分子对接与评分法相似,具备大规模应用的条件。因此,该新算法能够取代现在主流的分子
对接和评分技术,被广泛应用于药物筛选中。
附图说明
[0020]图1为本专利技术算法应用于计算机辅助药物筛选的流程图。
具体实施方式
[0021]下面结合附图和具体实施方式对本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机辅助虚拟高通量筛选算法,其特征在于:包括分子重叠和分子评分两部分;分子重叠包括:数据库中的候选分子的结合态构象是通过直接叠加到参考分子的晶体结构上获得的,参考分子为有晶体结构参数的药物分子,如果存在多个符合条件的药物分子,则选择和蛋白靶标具有最强亲和力的作为参考分子;分子重叠的算法包括:分子碎片重叠法、相似分子重叠法和基于药效团模型的三维重叠法,依据不同情况采用;当靶蛋白具有现有配体时,在进行虚拟筛选之前先分析现有配体的结合热力学性质,从中提取对结合自由能有重大贡献的关键子结构或官能团,即分子碎片;然后应用该子结构或官能团来搜索数据库,发现那些具有相同分子碎片的化合物;对每个新发现的化合物,以分子碎片为基准把它重叠到现有配体与靶蛋白的晶体结构中,然后针对该化合物进行能量最小化处理;如果现有配体中没有对结合自由能的贡献特别突出的分子碎片,就采用相似分子重叠法来进行数据库筛选;数据库中的每个化合物都与现有配体进行相似性分析并给化合物的相似性评分,完全一样为1.0,完全不一样为0.0;如果分子整体的相似性大于0.8,则以分子碎片为基本单位,每个分子碎片也赋一个相似性的值,并按照相似性排序;选出相似性最高的3个分子碎片,并依此为基准将化合物重叠到现有配体与靶蛋白的晶体结构中,然后针对该化合物进行能量最小化处理;当靶蛋白没有可用的配体时,根据靶蛋白的结合位点创建一个3

D药效团模型;用药效团模型筛选数据库,寻找具有药效团模型特征的化合物;仅在数据库搜索步骤中应用2

D药效团模型,在对被选中的化合物评估步骤中应用3

D特征;药效团模型生成算法如下:首先将间距为的3D网格应用于目标蛋白的结合位点;然后用氢键供体、氢键受体和疏水基团三种探针对网格点进行能量评估;然后将被识别为强相互作用点的网格点进行聚集以形成药效团模型的相互作用中心,相互作用中心的数量限制为不超过4个;然后再把数据库中通过2

D筛选的化合物的3

D药效团与...

【专利技术属性】
技术研发人员:陈炜
申请(专利权)人:南昌立德生物技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1