【技术实现步骤摘要】
基于深度图模型的抗体结构预测方法
[0001]本专利技术涉及生物信息学
,尤其是涉及基于深度图模型的抗体结构预测方法。
技术介绍
[0002]蛋白质在广泛的生物过程中发挥着关键作用,包括催化代谢反应、响应刺激和运输分子,是生命活动的物质基础。这些生物活性在很大程度上取决于蛋白质三级结构的精细细节。其中,抗体是由于生物体对入侵病原体的免疫反应而产生的一种特殊的蛋白质。由于抗体的特异性和广泛适用性,对抗体的研究一向是生物学和医学领域的一大热点。而随着计算机技术的发展,采用机器学习和深度学习的方法对抗体进行研究也获得了人们的关注。抗体上的互补决定区(CDR)是其实现高特异性的重要原因,了解抗体不同区域的三维结构可以大大促进对其特异性功能的理解。
[0003]目前,X
‑
晶体衍射、核磁共振(NMR)和冷冻电镜技术等实验方法是测定蛋白质三级结构的主流,但是这些实验在时间和金钱上都耗费巨大,无法实现大规模蛋白质的结构解析。因此,科学的计算方法对蛋白质三维结构预测具有重大意义,不仅可以弥补蛋白质序列测定和蛋 ...
【技术保护点】
【技术特征摘要】
1.基于深度图模型的抗体结构预测方法,其特征在于,包括如下步骤:步骤一,在蛋白质结构数据库中搜寻与目标抗体序列相似的序列,生成多序列联配和模板序列,并使得目标抗体序列与模板序列相对齐;然后构建特征提取模块,从多序列联配和模板信息生成初始的MSA特征和Pair特征;步骤二,构建双轨的特征更新模块,使用轴向注意力机制实现MSA特征、Pair特征、以及MSA特征和Pair特征之间的更新;步骤三,基于图Transformer构建特征聚合模块,对MSA特征和Pair特征进行进一步的更新和聚合,以获取MSA特征和Pair特征的最终嵌入表示;步骤四,构建距离图预测模块,搭建一个深度残差卷积网络,基于MSA特征和Pair特征预测残基对之间的相对距离和方向矩阵;步骤五,基于残基对之间的相对距离和方向矩阵,通过多维尺度分析来构建初始抗体结构;构造约束的势能函数,并对势能函数进行优化,以获取势能最小化的抗体三维结构。2.根据权利要求1所述的抗体结构预测方法,其特征在于,步骤一中初始的MSA特征和Pair特征的生成过程如下:将多序列联配中单个氨基酸和间隔视为字符,通过嵌入层将它们映射为d
msa
维的向量,以获取初始的MSA特征,表示为其中,N表示多序列联配中序列的数量,L表示多序列联配中残基的数量;将位置相似性和对齐置信度得分作为1D特征矩阵f
1D
,将通过HHSearch得到的HHSearch概率,将序列相似性和序列同一性作为标量特征矩阵f
0D
,并将1D特征矩阵f
1D
和标量特征矩阵f
0D
相连接,得到二维的输入矩阵;然后通过轴向注意力对二维的输入矩阵进行处理,然后使用像素级注意力机制将其合并为单个2D特征矩阵f
2D
;最后将2D特征矩阵f
2D
、初始的MSA特征、多序列联配的碱基对相对位置编码P
ij
相连接,并映射为d
pair
维的向量,作为Pair特征,表示为为其中,N
templ
表示模板序列的数量。3.根据权利要求2所述的抗体结构预测方法,其特征在于,步骤二中使用轴向注意力机制对MSA特征进行更新,即先在竖直方向进行列自注意力,然后再在水平方向进行行自注意力;对于列自注意力,使用门控的自注意力机制让属于相同目标残基的元素交换信息;对于行自注意力,引入可学习的位置权重与多序列联配的注意力相结合,以减少对未对齐区域的关注。4.根据权利要求3所述的抗体结构预测方法,其特征在于,步骤二中MSA特征和Pair特征之间的更新包括:MSA特征对Pair特征更新,采用CopulaNet方法中的外积和聚合思想从多序列联配中提取残基对间的相互作用信息,并计算共进化信号,通过共进化信号对Pair特征进行更新...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。