当前位置: 首页 > 专利查询>清华大学专利>正文

基于神经网络的冷冻电镜蛋白质模型搭建方法及存储介质技术

技术编号:37789516 阅读:27 留言:0更新日期:2023-06-09 09:19
本发明专利技术提供基于神经网络的冷冻电镜蛋白质模型搭建方法及存储介质,存储介质存储有深度神经网络,所述深度神经网络包括冷冻转换模块栈,冷冻转换模块栈包括多个冷冻转换模块Cryoformer;Cryoformer包括编码器和解码器;解码器用于学习序列相关表征和冷冻电镜密度图的三维空间信息的匹配,将序列相关表征和编码器输出的三维空间信息进行交叉融合。深度神经网络能够用于对冷冻电镜密度图进行处理,获取相应的蛋白质复合物结构的原子模型,高效准确,并能够针对低分辨率密度图进行处理,极大的扩展了自动化冷冻电镜模型搭建的适用范围。的扩展了自动化冷冻电镜模型搭建的适用范围。的扩展了自动化冷冻电镜模型搭建的适用范围。

【技术实现步骤摘要】
基于神经网络的冷冻电镜蛋白质模型搭建方法及存储介质


[0001]本专利技术属于结构生物学图像处理
,特别涉及一种计算机存储介质、一种计算机系统、一种冷冻电镜密度图处理方法以及一种基于神经网络的冷冻电镜蛋白质模型搭建方法。

技术介绍

[0002]随着单颗粒冷冻电子显微镜技术的突破性发展,特别是硬件和软件方面不断革新,冷冻电镜(cryo

EM)技术已成为解析具有重要生物学意义的大分子和细胞机器结构的关键方法,尤其是针对蛋白质复合物结构的场景。
[0003]尽管先进的基于机器学习的结构预测算法,如AlphaFold和RoseTTAFold,正在改变分析单个蛋白质三维结构的方式,然而,从冷冻电镜产生的电子云密度图自动搭建三维原子结构模型是一个高难度的工作,特别是多个蛋白组成的蛋白质复合物。要求模型的搭建者对蛋白质的结构特征、侧链构象有较高的认知水平,尤其是有许多密度差的区域,需要花费大量的时间进行推敲,甚至是补充额外的实验重新获得更高分辨率的密度图来解决。但是,获得高分辨率的密度图要求所解析的复合物具有良好的均匀性,而本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种计算机存储介质,其特征在于,存储有深度神经网络,所述深度神经网络包括冷冻转换模块栈,冷冻转换模块栈包括多个冷冻转换模块Cryoformer;Cryoformer包括编码器和解码器;解码器用于学习序列相关表征和冷冻电镜密度图的三维空间信息的匹配,将序列相关表征和编码器输出的三维空间信息进行交叉融合。2.根据权利要求1所述的计算机存储介质,其特征在于,所述解码器以深度神经网络的序列分支的输出、编码器的输出以及冷冻电镜密度图的三维位置编码为输入,通过自注意力模块和交叉注意力模块生成交叉的单序列表征。3.根据权利要求2所述的计算机存储介质,其特征在于,每个Cryoformer包括N
enc
个编码器和N
dec
个解码器;序列相关表征包括多序列表征和氨基酸间配对表征;每个解码器将多序列表征和氨基酸间配对表征分别通过线性层后与交叉的单序列表征进行相加,并各自通过LayerNorm层后进行相加,形成新的单序列表征;新的单序列表征输入到自注意力模块中;自注意力模块的输出、氨基酸嵌入表征、编码器的输出以及密度图的三维位置编码一起输入到交叉注意力模块中,进行冷冻电镜密度图特征和序列特征的匹配。4.根据权利要求3所述的计算机存储介质,其特征在于,交叉注意力模块以Q
c
、K
c
和V
c
三个变量作为输入,其中Q
c
为自注意力模块的输出与氨基酸嵌入表征相加的结果,K
c
为编码器输出的密度图表征与密度图的三维位置编码相加的结果,V
c
为编码器输出的密度图表征。5.根据权利要求4所述的计算机存储介质,其特征在于,交叉注意力模块的输出与自注意力模块的输出相加后输入第三LayerNorm层,第三LayerNorm层的输出经过线性层处理后与第三LayerNorm层的输出叠加,输入第四LayerNorm层处理,并输出新的交叉的单独序列表征。6.根据权利要求1

【专利技术属性】
技术研发人员:张强锋徐魁
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1