基于深度学习冷冻电镜三维密度图的局部质量评估方法技术

技术编号:37379920 阅读:8 留言:0更新日期:2023-04-27 07:22
一种基于深度学习的三维密度图局部质量评估方法,通过构建基于VisionTransformer为骨干网络的DeepQs深度学习模型,并以重采样得到的冷冻电镜三维密度图的局部密度图为输入,以对应的原子结构与相匹配的重采样后的三维密度图的之间的Q

【技术实现步骤摘要】
基于深度学习冷冻电镜三维密度图的局部质量评估方法


[0001]本专利技术涉及的是一种图像处理领域的技术,具体是一种基于深度学习冷冻电镜三维密度图的局部质量评估方法。

技术介绍

[0002]目前冷冻电镜图像的重构技术主要是以分辨率为数值指标评估,包括傅里叶壳相关(FSC)方法和ResMap方法,前者使用两个各使用一半冷冻电镜图像构建出来的三维密度图,然后计算两个半数据集重构结果在傅里叶空间的相关性,得到FSC曲线,选定特定的阈值截取,在该阙值下的数值便是全局分辨率;ResMap方法检测不同的正弦波长信号在三维密度图的各个点上,在所有波长中最小且可高于噪声信号的,将该波长定为该点的局部分辨率。但现有的FSC阙值选取无直观含义,ResMap无法处理经过锐化以及滤波后的三维密度图,最后前述现有方法的评估标准与所希望的重构出的原子结构模型并无直接联系等等。

技术实现思路

[0003]本专利技术针对现有技术存在的上述不足,提出一种基于深度学习的三维密度图局部质量评估方法,通过深度学习方法,训练出一个仅需三维密度图输入即可得到近似评估的模型,结合使用原子在冷冻电镜三维密度图中的可分解性分数(Q

score),可以对三维密度图的每一个局部区域进行打分,并获得质量评估图。
[0004]本专利技术是通过以下技术方案实现的:
[0005]本专利技术涉及一种基于深度学习的三维密度图局部质量评估方法,构建基于Vision Transformer为骨干网络的DeepQs深度学习模型,并以重采样得到的冷冻电镜三维密度图的局部密度图为输入,以对应的原子结构与相匹配的重采样后的三维密度图的之间的Q

score为标签进行训练,在在线阶段对待测冷冻电镜重构出的生物大分子模型的三维密度图进行重采样后,通过掩膜获取感兴趣区域后输入训练后的DeepQs深度学习模型进行局部质量评估并得到质量评估图。
[0006]所述的冷冻电镜三维密度图是指:一个大小为w
×
h
×
d的三维矩阵,矩阵中的每一个元素即体素,每一个体素的坐标(x,y,z)是其在空间中的相对坐标,每个体素的数值为的物理意义为其所在坐标的电子密度。
[0007]所述的重采样是指:通过软件将生物大分子三维密度图的体素之间的最小间距统一调整为以保证模型输入的密度图在物理意义上的一致。
[0008]所述的Q

score是指:在已配准的原子结构中,计算原子结构的每一个原子周围点的在三维密度图上映射值与参考类高斯函数之间的相关性,具体为:对于图中任一原子的周围密度分布符合的高斯分布,其中:A=avg
M
+10σ
M
,B=avg
M


M
,M为三维密度图,avg
M
为三维密度图的平均密度;在输入范围内以步距均匀采样得到输出的各个值组成向量u;在三维密度图内距离该原子中心坐标欧式距离
的位置插值采样密度值,获得向量v;分别计算向量u和向量v的均值u
mean
与v
mean
,得到该原子的Q

score为
[0009]所述的DeepQs深度学习模型包括:三维矩阵降维模块、Transformer编码器模块以及输出模块,其中:为适配密度图的三维矩阵输入,三维矩阵降维模块将输入的三维矩阵先均分为多个3
×3×
3的三维矩阵小块,利用三维卷积技术,结合同样3
×3×
3的参数矩阵W,两者进行卷积,将每个三维小块映射到1维空间中,根据使用的参数矩阵W的个数n=128,最后可以把3
×3×
3的矩阵小块映射成1
×
128的向量,最后共27个小块,获得数据维度为27
×
128;基于多头自注意力机制与多层感知结合的Transformer编码器模块由残差链接构成的区块组成,通过获取各个矩阵小块之间的联系,帮助网络进行学习;输出单元将Transformer编码器模块的输出通过多层感知机以及tanh函数后,得到输出结果。
[0010]所述的局部密度图是指:相对整个生物大分子的三维密度图,计算每个采样点的质量评估分数,无需全局的信息,只需裁取周围部分的区域,该区域即局部密度图。
[0011]所述的采样点为已配准的原子结构模型中的原子坐标且三维密度图与原子结构模型使用同一个坐标系,以采样点为中心,向四周扩张,共9
×9×
9的立方体区域为采样的局部密度图。若扩张区域超出范围,采取补0的操作,补成完整的9
×9×
9的立方体。
[0012]所述的掩膜是指一个与输入三维密度图有同样的尺寸,仅由0与1构成的三维矩阵。通过掩膜可以将背景噪声以及负值区域与感兴趣的大分子主体区域分离。掩膜的构建通常通过设定阙值来确定,将高于阙值的区域值置1,低于阙值的区域设置为0。
[0013]所述的质量评估分数是指:通过DeepQs输出后原三维密度图中掩膜为值1的体素会得到范围在

1~1的代表局部区域的可分解性的评估分数,将所有DeepQs分数加和取平均之后得到的分数为对整体三维密度图的整体质量评估,越接近1,在本专利技术的评分法则中三维重构模型的质量评分越高,反之质量评分越低。技术效果
[0014]本专利技术将原子结构的评价指标应用于冷冻电镜三维密度图质量评估上,并结合深度学习使用。与现有技术相比,无需输入原子结构就能预测冷冻电镜密度图与原子模型的拟合度,能完善现有技术的部分缺陷,如本方法无需如FSC方法输入两个一半数据集重构的模型,无需计算噪声分布,直接输入已重构好的三维密度图与掩膜阙值即可,使用简便快速。最后与其他局部分辨率方法相比,本专利技术不存在无法评估锐化后的三维密度图的问题。
附图说明
[0015]图1为本专利技术流程图;
[0016]图2为实施例生物大分子原子结构模型示意图;
[0017]图3为实施例冷冻电镜三维密度图示意图;
[0018]图4为实施例DeepQs模型输出质量评估图示意图;
[0019]图5为实施例多个冷冻电镜三维密度图的DeepQs输出平均与全局分辨率关系拟合曲线图;
[0020]图6为DeepQs的神经网络结构图。
具体实施方式
[0021]如图1所示,为本实施例涉及的一种基于深度学习冷冻电镜三维密度图的局部质量评估方法,包括:
[0022]第一步,根据数据集的采样要求从的分辨率范围中均匀选取生物大分子三维密度图,以及匹配好的原子结构模型,最终共选取495对数据作为基础数据集。
[0023]如图2与图3所示,为生物大分子的冷冻电镜三维密度图以及相应匹配的原子模型结构。该数据集共有495对生物大分子的冷冻电镜三维密度图以相应匹配的原子模型结构。
[0024]第二步,对每一对的生物大分子三维密度图,以及匹配好的原子结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的三维密度图局部质量评估的方法,其特征在于,通过构建基于Vision Transformer为骨干网络的DeepQs深度学习模型,并以重采样得到的冷冻电镜三维密度图的局部密度图为输入,以对应的原子结构与相匹配的重采样后的三维密度图的之间的Q

score为标签进行训练,在在线阶段对待测冷冻电镜重构出的生物大分子模型的三维密度图进行重采样后,通过掩膜获取感兴趣区域后输入训练后的DeepQs深度学习模型进行局部质量评估并得到质量评估图;所述的Q

score是指:在已配准的原子结构中,计算原子结构的每一个原子周围点的在三维密度图上映射值与参考类高斯函数之间的相关性,具体为:对于图中任一原子的周围密度分布符合的高斯分布,其中:A=avg
M
+10σ
M
,B=avg
M


M
,M为三维密度图,avg
M
为三维密度图的平均密度;在输入范围内以步距均匀采样得到输出的各个值组成向量u;在三维密度图内距离该原子中心坐标欧式距离的位置插值采样密度值,获得向量v;分别计算向量u和向量v的均值u
mean
与v
mean
,得到该原子的Q

score为2.根据权利要求1所述的基于深度学习的三维密度图局部质量评估的方法,其特征是,所述的冷冻电镜三维密度图是指:一个大小为w
×
h
×
d的三维矩阵,矩阵中的每一个元素即体素,每一个体素的坐标(x,y,z)是其在空间中的相对坐标,每个体素的数值为的物理意义为其所在坐标的电子密度;所述的重采样是指:通过软件将生物大分子三维密度图的体素之间的最小间距统一调整为以保证模型输入的密度图在物理意义上的一致。3.根据权利要求1所述的基于深度学习的三维密度图局部质量评估的方法,其特征是,所述的DeepQs深度学习模型包括:三维矩阵降维模块、Transformer编码器模块以及输出模块,其中:为适配密度图的三维矩阵输入,三维矩阵降维...

【专利技术属性】
技术研发人员:冯明峰沈红斌
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1