结合剂的计算机生成制造技术

技术编号:41249269 阅读:27 留言:0更新日期:2024-05-09 23:58
在一些实施例中,披露了用于提供一种或多种相关生物聚合物序列以符合参考结构的方法和相应的系统。该参考结构包含靶复合物和一种或多种相关生物聚合物序列。这些生物聚合物序列可通过该方法获得,该方法包括使用神经网络嵌入图表示。该图表示是根据该参考结构特征化的且包含该生物聚合物的拓扑结构,其中以单体为节点,以单体之间的相互作用为边缘。在某些实施例中,该方法还包括使用图神经网络或等变神经网络处理该图表示,该图神经网络或等变神经网络利用学习的参数函数迭代地更新节点和边缘嵌入。该方法还可以包括使用解码器将嵌入的图表示转换为能量景观。该方法还可以包括从该能量景观获得一种或多种生物聚合物序列。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、生物聚合物是生命的基本结构单元,既可以作为干预靶标,也可以作为效应器(例如抗体、抗体药物缀合物、融合蛋白和适体等治疗剂)。活性调节的常见前提是一种或多种生物聚合物通过结合形成复合物的能力。现存的计算机建模技术通常不适合生成结合物序列。

2、因此,需要用于计算机生成结合剂(例如生物聚合物)的系统和方法。


技术实现思路

1、生物聚合物(蛋白质、核酸、碳水化合物等)的骨架结构代表生物聚合物序列(例如氨基酸序列、核苷酸序列、碳水化合物序列)的物理形状。生物聚合物序列可以表示为单体序列,并且它们的骨架结构代表这些序列的三维构象(例如,当折叠时、当与其他生物聚合物复合时)。多个骨架结构可以相互连接(例如抗体和抗原)。现有的基于骨架结构确定序列的方法依赖于基于物理的模型和搜索算法,这通常是麻烦、缓慢且低效的。

2、在一些实施例中,披露了用于提供一种或多种相关生物聚合物序列以符合参考结构的方法和相应的系统。参考结构包含靶复合物。在实施例中,参考结构可以包括一种或多种参考生物聚合物序列。本文档来自技高网...

【技术保护点】

1.一种方法,其包括提供一种或多种相关生物聚合物序列以符合参考结构,该参考结构包含靶复合物,这些相关生物聚合物序列可通过包括以下各项的方法获得:

2.如权利要求1所述的方法,其中该能量景观是序列的条件生成模型。

3.如权利要求1所述的方法,其中该能量景观是表示该靶复合物和该一种或多种相关生物聚合物序列的条件随机场。

4.如前述权利要求中任一项所述的方法,其中从该能量景观获得该一种或多种生物聚合物序列采用最大似然法。

5.如前述权利要求中任一项所述的方法,其中从该能量景观获得该一种或多种生物聚合物序列采用能量最小化过程。</p>

6.如权...

【技术特征摘要】
【国外来华专利技术】

1.一种方法,其包括提供一种或多种相关生物聚合物序列以符合参考结构,该参考结构包含靶复合物,这些相关生物聚合物序列可通过包括以下各项的方法获得:

2.如权利要求1所述的方法,其中该能量景观是序列的条件生成模型。

3.如权利要求1所述的方法,其中该能量景观是表示该靶复合物和该一种或多种相关生物聚合物序列的条件随机场。

4.如前述权利要求中任一项所述的方法,其中从该能量景观获得该一种或多种生物聚合物序列采用最大似然法。

5.如前述权利要求中任一项所述的方法,其中从该能量景观获得该一种或多种生物聚合物序列采用能量最小化过程。

6.如权利要求5所述的方法,其中该能量最小化过程采用蒙特卡洛模拟、模拟退火、整数线性规划、遗传过程、变分推断或基于连续松弛的优化。

7.如前述权利要求中任一项所述的方法,其中该解码器是生成模型或条件生成模型,其选自以下各项中的至少一项:

8.如前述权利要求中任一项所述的方法,其中该解码器被构造为条件随机场。

9.如权利要求8所述的方法,其中该条件随机场由第一项和第二项参数化,该第一项表示该参考结构中的每个位置处的单体偏差,并且该第二项表示该结构中的单体之间的相互依赖性。

10.如权利要求9所述的方法,其中该一种或多种相关生物聚合物序列是蛋白质,并且该条件随机场由表征,其中si是指在位置i处的单体同一性,x是指该参考结构的整个骨架结构,hi[si;x]是指给定si的情况下由该网络输出的在位置i处的单体类型x的偏差项,并且jij[si,sj;x]是指在位置si处的单体类型i与在位置sj处的单体类型j之间的偶联项。

11.如前述权利要求中任一项所述的方法,其中该靶复合物包含该生物聚合物。

12.如前述权利要求中任一项所述的方法,其中该靶复合物包含非生物聚合物的分子。

13.如前述权利要求中任一项所述的方法,其中该靶复合物是包含两种或更多种参考生物聚合物序列的复合物。

14.如权利要求13所述的方法,其中从该能量景观获得该一种或多种相关生物聚合物序列还包括获得与将包含该两种或更多种参考生物聚合物序列的靶复合物进行结合有关的一种或多种相关生物聚合物序列。

15.如前述权利要求中任一项所述的方法,其中单体的该拓扑结构包括作为通过径向基函数、角度嵌入和至少一种分类离散化而得到的向量值的键长、键角、二面角、标量长度和角度中的一个或多个的表示。

16.如前述权利要求中任一项所述的方法,其中该拓扑结构基于k最近邻,其中k约为:10、15、20、25、30、35、40、45、50或以上。

17.如前述权利要求中任一项所述的方法,其中该拓扑结构基于的单体质心距离约为:5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20埃或更多。

18.如权利要求17所述的方法,其中该生物聚合物是蛋白质,该单体质心是该蛋白质中氨基酸的α-碳。

19.如前述权利要求中任一项所述的方法,其中这些边缘包括以下各项中的一项或多项:单体之间的一级序列距离、该参考结构中的单体对是在相同的聚合物中还是在不同的聚合物中、单体之间的原子间距离、第一单体i处的原子和第二单体j处的原子的相对取向,例如,该第二单体j处的原子当规范化转换到基于该第一单体i的参考系中时的相对位置、该第一单体i处和该第二单体j处的原子之间的原始笛卡尔位移。

20.如前述权利要求中任一项所述的方法,其中该方法用于提供该一种或多种相关生物聚合物序列的全链设计以符合该参考结构,该参考结构包括由天然存在的序列形成的结构、由计算机生成的序列形成的结构和与序列不相关联的计算机生成的结构中的至少一...

【专利技术属性】
技术研发人员:J·英格拉汉姆
申请(专利权)人:旗舰开拓创新六世公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1