Systems, devices, and methods for predicting binding affinity. Store records that reflect input data. Constructing a data structure for providing a geometric representation of input features. The data structure is filled by encoding data associated with at least one molecule and at least one of the target proteins. Application of a prediction model to the data structure to produce at least one molecule binding affinity to at least one target protein.
【技术实现步骤摘要】
【国外来华专利技术】专利
本公开总体上涉及生物信息学系统,并且更具体地说涉及用于预测一种或多种分子的结合亲和力的系统和方法。
技术介绍
准确地预测分子对蛋白质的结合亲和力的能力是发现新药以及阐明天然和工程化生物过程的基本工具。遗憾的是,在结合亲和力预测过程中,制约结合的因素的数目相当广泛并且对它们的相互作用知之甚少。预测的准确性取决于预测模型考虑到的特征。一些结合亲和力预测解决方案是已知的,包括结合机器学习特征的那些。一些现有技术解决方案使用相对简单的预测模型,所述预测模型可能并未反映化学结构和蛋白质结构的复杂性。另外,所述预测模型可能未反映分子与蛋白质之间影响结合亲和力的相互作用的许多变量。例如,分子与蛋白质之间的给定相互作用可能会受到以下各项的影响:距离、角度、原子类型、电荷和极化以及周围环境稳定或使其失去稳定性的涉及的环境因素。现有技术解决方案使用简单的特征,例如像基于知识的评分函数,所述评分函数使用原子对/原子组,例如,一个原子来自分子(诸如药物靶标),并且一个原子来自蛋白质。之后例如通过评价这些对之间的距离以推导出可能的分子/蛋白质结合原子对来分析这些对。可以将评分聚集起来,并且可以分析这些聚集的评分,以便于确定分子/蛋白质结合亲和力或“配合度”。结合亲和力预测解决方案的性能取决于所使用的模型,并且这些模型通常都是手动构建和训练的,这是费时的。现有技术结合亲和力解决方案通常包括(i)基于知识的,(ii)经验的,或(iii)包括基于力场的评分函数的解决方案。基于知识的特征典型地由对在生物复合物中隔开给定距离的原子或者官能团的配对次数的计数组成。由于这些特征是简单的(两 ...
【技术保护点】
一种用于预测结合亲和力的系统,所述系统包括:至少一个电子数据存储体,其被配置来存储反映输入数据的记录;编码器模块,其配置来:构建提供对结合输入特征的几何表示的数据结构;通过编码与至少一种分子和至少一种靶蛋白相关的数据来填充所述数据结构,用于编码的所述数据选自所述存储的输入数据;以及预测模块,其被配置来:将预测模型应用于所述数据结构以产生至少一种分子对至少一种靶蛋白的结合亲和力的指示符。
【技术特征摘要】
【国外来华专利技术】2014.05.05 US 61/988,5101.一种用于预测结合亲和力的系统,所述系统包括:至少一个电子数据存储体,其被配置来存储反映输入数据的记录;编码器模块,其配置来:构建提供对结合输入特征的几何表示的数据结构;通过编码与至少一种分子和至少一种靶蛋白相关的数据来填充所述数据结构,用于编码的所述数据选自所述存储的输入数据;以及预测模块,其被配置来:将预测模型应用于所述数据结构以产生至少一种分子对至少一种靶蛋白的结合亲和力的指示符。2.如权利要求1所述的系统,其中所述几何表示包括原子中心的多个坐标。3.如权利要求1所述的系统,其中所述几何表示包括多个体素,每个体素表示一个原子的位置。4.如权利要求3所述的系统,其中所述几何表示包括三维体素网格。5.如权利要求1至4中任一项所述的系统,其中所述几何表示具有介于与之间的分辨率。6.如权利要求5所述的系统,其中所述几何表示具有的分辨率。7.如权利要求1至6中任一项所述的系统,其中所述预测模块被配置来训练所述预测模型。8.如权利要求1至7中任一项所述的系统,其中所述预测模块被配置来应用预测模型的集合体以产生所述结合亲和力的所述指示符。9.如权利要求1至8中任一项所述的系统,其中所述预测模块被配置来通过应用预先限定的变换来扩充所述输入数据。10.如权利要求9所述的系统,其中所述预先限定的变换包括旋转操作、平移操作和镜像操作中的至少一种。11.如权利要求1至10中任一项所述的系统,其中所述数据结构具有预先限定的大小。12.如权利要求1至11中任一项所述的系统,其中所述应用所述预测模型包括应用深度学习技术。13.如权利要求1至12中任一项所述的系统,其中所述输入数据记录包括反映与以下各项中的至少一项相关的输入数据的记录:原子、配体分子、...
【专利技术属性】
技术研发人员:A·S·海菲兹,I·瓦拉赫,M·迪萨巴,
申请(专利权)人:艾腾怀斯股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。