System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,具体为深度学习和生物计算等,尤其涉及一种双环肽生成及模型训练方法、装置、设备和介质。
技术介绍
1、多肽类药物在药物开发领域具有重要前景,与传统小分子药物相比,多肽类药物可覆盖更大的蛋白质-蛋白质相互作用界面,且降解产物无毒,符合生物安全性,多肽类药物制备技术成熟,成本和时间可控,且合成多肽已实现商品化定制。设计出与特定蛋白受体紧密结合的双环肽能够进一步有效改善多肽类药物的结构稳定性问题,并使得多肽类药物能够更准确地作用于目标受体,减少副作用,因此,如何设计出与特定蛋白受体紧密结合的双环肽是非常重要的。
技术实现思路
1、本公开提供了一种双环肽生成及模型训练方法、装置、设备和介质。
2、根据本公开的一方面,提供了一种双环肽生成方法,包括:
3、获取靶标蛋白序列和初始多肽序列;
4、将所述靶标蛋白序列和所述初始多肽序列输入至分子结构预测模型中,以得到所述分子结构预测模型输出的初始多肽-蛋白复合物结构的至少一个置信度得分;
5、基于所述初始多肽-蛋白复合物结构的至少一个置信度得分,对所述初始多肽序列执行至少一次更新,以得到目标双环肽。
6、根据本公开的另一方面,提供了一种分子结构预测模型的训练方法,包括:
7、获取样本靶标蛋白序列和样本多肽序列,并获取所述样本靶标蛋白序列和所述样本多肽序列对应的标注多肽-蛋白复合物结构和所述标注多肽-蛋白复合物结构的至少一个标注置信度得分;
8、将所
9、根据所述标注多肽-蛋白复合物结构和所述预测多肽-蛋白复合物结构之间的差异,以及所述至少一个标注置信度得分和所述至少一个预测置信度得分之间的差异,生成损失函数值;
10、根据所述损失函数值,对所述初始的分子结构预测模型进行训练。
11、根据本公开的又一方面,提供了一种双环肽生成装置,包括:
12、获取模块,用于获取靶标蛋白序列和初始多肽序列;
13、输入模块,用于将所述靶标蛋白序列和所述初始多肽序列输入至分子结构预测模型中,以得到所述分子结构预测模型输出的初始多肽-蛋白复合物结构的至少一个置信度得分;
14、更新模块,用于基于所述初始多肽-蛋白复合物结构的至少一个置信度得分,对所述初始多肽序列执行至少一次更新,以得到目标双环肽。
15、根据本公开的再一方面,提供了一分子结构预测模型的训练装置,包括:
16、获取模块,用于获取样本靶标蛋白序列和样本多肽序列,并获取所述样本靶标蛋白序列和所述样本多肽序列对应的标注多肽-蛋白复合物结构和所述标注多肽-蛋白复合物结构的至少一个标注置信度得分;
17、预测模块,用于将所述样本靶标蛋白序列和所述样本多肽序列输入至初始的分子结构预测模型中,以得到所述分子结构预测模型输出的预测多肽-蛋白复合物结构和所述预测多肽-蛋白复合物结构的至少一个预测置信度得分;
18、生成模块,用于根据所述标注多肽-蛋白复合物结构和所述预测多肽-蛋白复合物结构之间的差异,以及所述至少一个标注置信度得分和所述至少一个预测置信度得分之间的差异,生成损失函数值;
19、训练模块,用于根据所述损失函数值,对所述初始的分子结构预测模型进行训练。
20、根据本公开的又一方面,提供了一种电子设备,包括:
21、至少一个处理器;以及
22、与所述至少一个处理器通信连接的存储器;其中,
23、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开上述一方面提出的方法,或者,执行本公开上述另一方面提出的方法。
24、根据本公开的再一方面,提供了一种计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开上述一方面提出的方法,或者,执行本公开上述另一方面提出的方法。
25、根据本公开的还一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开上述一方面提出的方法,或者,执行本公开上述另一方面提出的方法。
26、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种双环肽生成方法,包括:
2.根据权利要求1所述的方法,其中,所述至少一次更新中的第i次更新,包括:
3.根据权利要求2所述的方法,其中,所述响应于i等于1,基于所述初始多肽-蛋白复合物结构的至少一个置信度得分,判断首次更新得到的多肽序列是否收敛,包括:
4.根据权利要求3所述的方法,其中,所述根据所述首次更新的多肽-蛋白复合物结构的至少一个置信度得分和所述初始多肽-蛋白复合物结构的至少一个置信度得分,确定所述首次更新得到的多肽序列是否收敛,包括:
5.根据权利要求4所述的方法,其中,所述根据所述首次更新的多肽-蛋白复合物结构的至少一个置信度得分,确定所述首次更新得到的多肽序列的奖励分数,包括:
6.根据权利要求4所述的方法,其中,所述方法还包括:
7.根据权利要求2所述的方法,其中,所述响应于i大于1,基于第i-1次更新的多肽-蛋白复合物结构的至少一个置信度得分,判断所述第i次更新得到的多肽序列是否收敛,包括:
8.根据权利要求7所述的方法,其中,所述从动作集合中,确定第i次更新的执行动作
9.根据权利要求2-8中任一项所述的方法,其中,所述目标双环肽为最后一次更新得到的多肽序列。
10.一种分子结构预测模型的训练方法,包括:
11.根据权利要求10所述的方法,其中,所述根据所述标注多肽-蛋白复合物结构和所述预测多肽-蛋白复合物结构之间的差异,以及所述至少一个标注置信度得分和所述至少一个预测置信度得分之间的差异,生成损失函数值,包括:
12.一种双环肽生成装置,包括:
13.根据权利要求12所述的装置,其中,所述更新模块执行第i次更新,具体为:
14.根据权利要求13所述的装置,其中,所述更新模块,具体用于:
15.根据权利要求14所述的装置,其中,所述更新模块,具体用于:
16.根据权利要求15所述的装置,其中,所述更新模块,具体用于:
17.根据权利要求15所述的装置,其中,所述更新模块,还用于:
18.根据权利要求13所述的装置,其中,所述更新模块,具体用于:
19.根据权利要求18所述的装置,其中,所述更新模块,具体用于:
20.根据权利要求13-19中任一项所述的方法,其中,所述目标双环肽为最后一次更新得到的多肽序列。
21.一种分子结构预测模型的训练装置,包括:
22.根据权利要求21所述的装置,其中,所述生成模块,具体用于:
23.一种电子设备,其中,所述电子设备包括:
24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法,或者,执行根据权利要求10-11中任一项所述的方法。
25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述方法的步骤,或者,实现根据权利要求10-11中任一项所述方法的步骤。
...【技术特征摘要】
1.一种双环肽生成方法,包括:
2.根据权利要求1所述的方法,其中,所述至少一次更新中的第i次更新,包括:
3.根据权利要求2所述的方法,其中,所述响应于i等于1,基于所述初始多肽-蛋白复合物结构的至少一个置信度得分,判断首次更新得到的多肽序列是否收敛,包括:
4.根据权利要求3所述的方法,其中,所述根据所述首次更新的多肽-蛋白复合物结构的至少一个置信度得分和所述初始多肽-蛋白复合物结构的至少一个置信度得分,确定所述首次更新得到的多肽序列是否收敛,包括:
5.根据权利要求4所述的方法,其中,所述根据所述首次更新的多肽-蛋白复合物结构的至少一个置信度得分,确定所述首次更新得到的多肽序列的奖励分数,包括:
6.根据权利要求4所述的方法,其中,所述方法还包括:
7.根据权利要求2所述的方法,其中,所述响应于i大于1,基于第i-1次更新的多肽-蛋白复合物结构的至少一个置信度得分,判断所述第i次更新得到的多肽序列是否收敛,包括:
8.根据权利要求7所述的方法,其中,所述从动作集合中,确定第i次更新的执行动作,包括:
9.根据权利要求2-8中任一项所述的方法,其中,所述目标双环肽为最后一次更新得到的多肽序列。
10.一种分子结构预测模型的训练方法,包括:
11.根据权利要求10所述的方法,其中,所述根据所述标注多肽-蛋白复合物结构和所述预测多肽-蛋白复合物结构之间的差异,以及所述至少一个标注置信度得分和所述至少一个...
【专利技术属性】
技术研发人员:薛洋,方晓敏,张肖男,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。