用于分子结构的输入集合的相互作用参数制造技术

技术编号:16308121 阅读:33 留言:0更新日期:2017-09-27 02:01
本发明专利技术涉及一种用于对受体‑配体复合物的界面的几何结构进行建模的方法、一种用于对受体‑配体复合物中受体和配体之间的相互作用进行建模的方法、一种用于确定评分向量w的方法(其中评分向量w是量化/限定受体‑配体复合物的界面的几何结构的相互作用的数学向量)、一种用于确定一个或多个受体‑配体复合物中配体相对于受体的位置的结合亲和力或结合自由能的方法、以及一种用于对一个或多个受体‑配体复合物中配体相对于受体的空间位置的结合亲和力或结合自由能进行排序的方法。

The interaction parameter for an input set of molecular structures

The invention relates to a method for geometric structure of receptor ligand complex interface modeling, a method for modeling the interactions between the receptor and the ligand receptor ligand complexes of the invention relates to a method for determining the score vector w (the score vector w is a mathematical vector interaction geometry quantitative structure / limited receptor ligand complexes of the interface), a method for determining one or more receptor ligand complexes relative to the ligand receptor binding affinity position or a combination of methods, free energy and a method for one or more ligand receptor ligand complexes with respect to the spatial position of the receptor binding affinity or binding free energy ordering.

【技术实现步骤摘要】
【国外来华专利技术】用于分子结构的输入集合的相互作用参数本专利技术涉及一种用于对受体-配体复合物的界面的几何结构进行建模的方法、一种用于对受体-配体复合物中受体和配体之间的相互作用进行建模的方法、一种用于确定评分向量w的方法(其中评分向量w是量化和/或限定受体-配体复合物的界面的几何结构的相互作用的数学向量)、一种用于确定在一个或多个受体-配体复合物中配体相对于受体的位置的结合亲和力或结合自由能的方法、以及一种用于对在一个或多个受体-配体复合物中配体相对于受体的空间位置的结合亲和力或结合自由能进行排序的方法。所有这些方法都包括由计算机实现或辅助的一个或多个步骤。本专利技术还涉及分子结构的计算机辅助设计或表示,尤其是分子相互作用的计算机辅助设计或表示。本专利技术还涉及实现或有助于实现所述方法的任何设备,即,对应的软件和硬件。本专利技术的应用是其中精确的分子相互作用对于性能是重要的或至关重要的所有应用,诸如计算机辅助药物设计、药学科学、医学、物理学和生物学。此外,本专利技术可以为计算机图形学、计算机视觉等中的机器学习应用提供优点。使用标准实验分析方法“结构分析关系”(SAR)开发新的活性分子(通常是药物)所需的平均时间约为10-15年,并且成本约为12亿美元。基于结构的药物设计(SBDD)将药物设计周期降至7-12年,并且成本约为10亿美元,从而既节省时间又节省金钱。因此,存在减少开发新活性分子的持续时间、开发新活性分子的成本或者甚至优选地减少这两者的巨大需要。特别地,本专利技术提供了对潜在的药物分子执行快速、准确和高效的虚拟筛选的方式,这是药物设计流水线的初始步骤。给定相互作用的分子的复合物,在技术上难以量化相互作用的分子之间的相互作用,该相互作用理想地对应于结合自由能或结合亲和力的实验值。因此,非常难以预测受体-配体复合物的结合亲和力,从而难以对最佳(最小)结合自由能或结合亲和力进行排序和选择,以便选择药物设计的(一个或多个)最佳候选者。需要克服这些技术问题。尽管用于获得评分函数(SF)的方法种类繁多,但是它们可以被分为三个主要的类别:基于力场的SF、经验SF和统计SF。-基于力场(FF)的SF将分数呈现为自由能到单独的基于物理学的相互作用项(诸如范德华能、静电能、键伸缩能、弯曲能等)的分解。经典的分子机械力场(诸如AMBER或CHARMM)被广泛用于此目的。基于力场的SF的主要挑战是:1)考虑溶剂分子;2)考虑熵效应;以及3)将结合自由能分解成相互作用项的线性组合的可能性。GOLD::GoldScore和SYBYL::G-Score/D-Score是由Cheng等人1评估的基于力场的SF。FF评分函数还被用于DOCK和AutoDock软件包中。总体而言,FF评分函数具有相当差的性能1并且不存在调整不同相互作用项之间的权重的严格的方法。-经验SF被构造为诸如去溶剂、静电相互作用、氢键、疏水相互作用等之类的项的加权和,αi:E=∑iαiEi。然后,系数αi被调整,以匹配一些实验数据(诸如结合亲和力),或者以获得已知天然结构上的评分函数的最小值。回归分析通常被用于这些目的。经验评分函数与FF评分函数相比计算效率高得多2:Glide、ICM、LUDI、PLP、ChemScore、X-Score、Surflex、SYBYL/F-Score、MedusaScore、AlScore、SFCscore是基于经验的评分函数的一些示例。总体而言,经验SF与FF评分函数相比而言性能更好1,但是具有调整它们的相互作用项之间的权重的相同问题。-另一方面,统计评分函数基于实验确定的结构中原子之间的距离遵循玻尔兹曼分布的观察。更精确地说,使用液体统计学理论的思想,使用逆波尔兹曼关系Eij(r)=-kBTln(Pij(r)/Z)来提取原子之间的有效势能,其中kBT是玻尔兹曼常数,Pij(r)表示发现类型i和j的两个原子距离为r的概率,并且Z表示参考状态下的概率分布。参考状态是当原子之间的所有相互作用被设置为零时蛋白质的热力学平衡状态。然后给出作为所有原子对之间的有效势能之和的蛋白质构型(conformation)的得分。虽然这个概念是旧的(它源自于Tanaka和Scheraga3、Miyazawa和Jernigan4以及Sippl5的工作),但是它仍然在争论之中。特别地,参考状态的计算是一个有挑战性的问题,并且仅仅在最近才进行了严格证明和计算它的尝试。ITScore、PMF、DrugScore、DFIRE、BLEEP、MScore、GOLD/ASP是一些基于知识的评分函数。在Cheng等人的比较评估1中评估了GOLD::ASP、DS::PMF、SYBYL::PMF和DrugScore。总体而言,统计SF是所有类型的基准和竞争的获胜者1,但是它们通常具有数千个参数,这些参数对于分子结构的训练集和优化算法的参数极其敏感。尽管有这些改进,但是仍然需要发现对潜在的药物分子执行更快、更准确和更高效的虚拟筛选的新的方式。因此,本专利技术的目的是解决上文描述的问题。更精确地说,如在许多不同的基准上验证的那样,本专利技术的方法和相关联的算法非常快速、健壮、通用并且对初始结构中的噪声稳定。因此,本专利技术代表了用于建模受体-配体复合物界面的几何结构、用于建模受体-配体复合物中受体和配体之间的相互作用、用于确定量化和/或限定受体-配体复合物界面的几何结构的相互作用的评分向量、用于确定一个或多个受体-配体复合物中配体相对于受体的位置的结合亲和力或结合自由能以及用于对一个或多个受体-配体复合物中配体相对于受体的空间位置的结合亲和力或结合自由能进行排序的重要改进。下面更详细地描述本专利技术。本专利技术涉及一种用于建模受体-配体复合物的界面的几何结构的方法,其中第一化学分子被定义为受体并且第二化学分子被定义为配体,其中所述方法包括以下步骤,其中以下步骤中的至少一个步骤由计算机实现或辅助:(a)从至少一个计算机数据库提供受体和配体的集合,其中受体-配体复合物呈现出包括不同原子类型的界面,其中原子类型k位于受体上并且原子类型l位于配体相互作用上,k和l依赖于原子类型而变化;(b)从所述受体和配体的受体-配体复合物界面选择原子;(c)向每个所选择的原子指派k和l之中的原子类型;(d)为受体-配体复合物提供受体的具有特定原子类型k的原子i与配体的具有特定原子类型l的原子j之间的距离rij,其中i索引在原子类型k之中的特定原子上运行(run),并且其中j索引在原子类型l之中的特定原子上运行;(e)对于所有或其它原子类型k和l,可选地重复步骤(c);(f)将距离rij指派为原子类型的函数;以及(g)提供作为距离rij的函数的受体-配体复合物的界面的几何结构的建模。在一个实施例中,界面是其距离小于截断距离rmax,以使得每对ij中的第一原子i属于受体并且每对ij中的第二原子j属于配体的所有原子对ij的集合。例如,界面是使用标准的链接单元(linked-cell)算法确定的原子的集合。更精确地说,使用利用受体的原子初始化的网格,受体-配体界面的原子以线性时间被选择为其中距离rij小于截断距离的原子。在一个实施例中,原子类型由所有重原子(即,除氢之外的所有原子)的根据它们的元素符号、芳香性、杂化和极性的分类来定义。例如,可本文档来自技高网...
用于分子结构的输入集合的相互作用参数

【技术保护点】
一种用于确定评分向量w的方法,所述评分向量w是量化和/或限定受体‑配体复合物的界面的几何结构的相互作用的数学向量,其中受体‑配体复合物在相互作用中呈现界面,其中所述相互作用需要量化和/或限定,其中所述方法包括以下步骤,其中以下步骤中的至少一个步骤由计算机实现或辅助:(a)从至少一个计算机数据库提供受体和配体的集合;(b)向受体‑配体复合物的界面的每个几何结构指派特定结构向量x,所述特定结构向量x是表示界面的特定几何结构的数学向量;(c)计算作为所有特定结构向量x和评分向量w的函数的线性凸评分函数F;(e)在正交多项式子空间中投影所述评分函数F;(f)用公式表示凸优化问题;(g)求解所述凸优化问题,由此确定评分向量w。

【技术特征摘要】
【国外来华专利技术】2014.11.25 EP 14306882.31.一种用于确定评分向量w的方法,所述评分向量w是量化和/或限定受体-配体复合物的界面的几何结构的相互作用的数学向量,其中受体-配体复合物在相互作用中呈现界面,其中所述相互作用需要量化和/或限定,其中所述方法包括以下步骤,其中以下步骤中的至少一个步骤由计算机实现或辅助:(a)从至少一个计算机数据库提供受体和配体的集合;(b)向受体-配体复合物的界面的每个几何结构指派特定结构向量x,所述特定结构向量x是表示界面的特定几何结构的数学向量;(c)计算作为所有特定结构向量x和评分向量w的函数的线性凸评分函数F;(e)在正交多项式子空间中投影所述评分函数F;(f)用公式表示凸优化问题;(g)求解所述凸优化问题,由此确定评分向量w。2.如权利要求1所述的方法,其中步骤(a)包括提供天然受体-配体复合物和非天然受体-配体复合物其中i索引在不同的蛋白质复合物上运行。3.如权利要求1所述的方法,其中在步骤(a)中,受体-配体复合物呈现包括不同原子类型的界面,其中原子类型k位于受体上,并且原子类型l位于配体相互作用上,k和l依赖于原子类型而变化,并且其中所述步骤(b)包括实现用于建模所述受体-配体复合物的界面的几何结构的方法,其中第一化学分子被定义为受体,第二化学分子被定义为配体,所述用于建模所述受体-配体复合物的界面的几何结构的方法包括:(b1)从所述受体和配体的受体-配体复合物界面中选择原子;(b2)向每个所选择的原子指派k和l之中的原子类型;(b3)为受体-配体复合物提供受体的特定原子类型k...

【专利技术属性】
技术研发人员:G·切列莫维斯基P·波波维G·杰列维扬科S·格鲁迪迪恩
申请(专利权)人:国家信息及自动化研究院国家科研中心
类型:发明
国别省市:法国,FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1