氨基酸序列生成模型的训练方法及其应用技术

技术编号:46589834 阅读:1 留言:0更新日期:2025-10-10 21:24
本申请涉及一种氨基酸序列生成模型的训练方法及其应用。该方法包括:获取训练数据,训练数据包括样本蛋白质的样本结构信息;对样本结构信息进行特征编码,获得样本蛋白质对应的节点特征和边特征;通过待训练的图神经网络模型的多个消息传递层对节点特征和边特征进行交替更新,获得更新后的目标节点特征及目标边特征;根据对应的目标节点特征及目标边特征,通过待训练的图神经网络模型按照随机顺序分别对各节点进行解码预测,输出预测序列信息;根据预测序列信息与样本序列信息计算的损失值迭代图神经网络模型的网络参数,获得训练好的氨基酸序列生成模型。本申请提供的方案,能够提高生成模型预测结果的泛化性和鲁棒性。

【技术实现步骤摘要】

本申请涉及序列预测,尤其涉及一种氨基酸序列生成模型的训练方法及其应用


技术介绍

1、蛋白质逆折叠是指根据给定的三维蛋白质主链结构,逆向推导出能够稳定折叠为该结构的氨基酸序列的计算过程。理解蛋白质的序列-结构关系对蛋白质序列的预测和设计至关重要,精确的氨基酸序列设计是创造新功能性蛋白质的核心。

2、相关技术中,受限于训练数据的稀缺性和现有模型的局限性,导致现有模型普遍存在泛化能力不足的问题,如何设计一种泛化性强的氨基酸序列生成模型是目前需要解决的问题。


技术实现思路

1、为解决或部分解决相关技术中存在的问题,本申请提供一种氨基酸序列生成模型的训练方法及其应用,能够提高模型的泛化性和鲁棒性。

2、本申请第一方面提供一种氨基酸序列生成模型的训练方法,其包括:

3、获取训练数据,所述训练数据包括样本蛋白质的样本结构信息及对应的样本序列信息;

4、对所述样本结构信息进行特征编码,获得所述样本蛋白质对应的节点特征和边特征;其中,所述节点特征用于表示残基信息,所述边特征用于本文档来自技高网...

【技术保护点】

1.一种氨基酸序列生成模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的训练方法,其特征在于:

3.根据权利要求1所述的训练方法,其特征在于,在所述图神经网络模型的编码器中,多个所述消息传递层至少包括第一消息传递层及第二消息传递层;

4.根据权利要求3所述的训练方法,其特征在于,所述通过待训练的图神经网络模型的多个消息传递层对节点特征和边特征进行交替更新,获得更新后的目标节点特征及目标边特征,包括:

5.根据权利要求3所述的训练方法,其特征在于,所述图神经网络模型的解码器的消息传递层的数量与编码器中的消息传递层的数量相同;其中:<...

【技术特征摘要】

1.一种氨基酸序列生成模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的训练方法,其特征在于:

3.根据权利要求1所述的训练方法,其特征在于,在所述图神经网络模型的编码器中,多个所述消息传递层至少包括第一消息传递层及第二消息传递层;

4.根据权利要求3所述的训练方法,其特征在于,所述通过待训练的图神经网络模型的多个消息传递层对节点特征和边特征进行交替更新,获得更新后的目标节点特征及目标边特征,包括:

5.根据权利要求3所述的训练方法,其特征在于,所述图神经网络模型的解码器的消息传递层的数量与编码器中的消息传递层的数量相同;其中:

6.根据权利要求1-5任一项所述的训练方法,其特征在于,所述损失值根据下述混合损失函数计算获得,包括:

7.根据权利要求1-6任一项所述的训练方法,其特征在于,所述获取训练数据,包括:

8.根据权利要求7所述的训练方法,其特征在于,所述从各第一蛋白...

【专利技术属性】
技术研发人员:夏春秋陈庚龙云飞
申请(专利权)人:晶泰智药技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1