【技术实现步骤摘要】
基于深度学习的冷冻电镜三维密度图后处理方法和装置
[0001]本专利技术属于结构生物学检测
,更具体地,涉及一种基于深度学习的冷冻电镜三维密度图后处理方法和装置。
技术介绍
[0002]由于在硬件和图像处理算法方面的不断进步,冷冻电镜(cryo
‑
EM)已成为结构生物学中测定生物大分子结构的标准技术之一。冷冻电镜的最终目标是从密度图中获得大分子复合物的原子模型,在这个过程中,冷冻电镜密度图的质量是至关重要的。然而,由于一些固有的影响,譬如分子运动,密度异质性以及较差的成像,原始的冷冻电镜密度图往往面临高分辨率对比度损失的问题,并不能立即用于准确的结构建模。
[0003]传统的密度图锐化方法大致可以分为两类:全局锐化方法和局部锐化方法。全局锐化方法通常在密度图上确定一个B因子,并在整个密度图上应用相同的密度校正。对于大多数电镜图,密度的信噪比在整个图上是不均匀的,而全局锐化方法很容易受到这种异质性的影响,从而产生过度锐化或者欠锐化的区域。与全局锐化方法不同的是,局部锐化方法考虑了冷冻电镜密度图的 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,包括以下步骤:S1:构建包括多个实验密度图和关联的PDB结构的训练样本集;S2:将每个所述实验密度图和其对应的模拟密度图进行分割,分别得到多个实验密度块和多个模拟密度块;将各个所述实验密度图对应的多个实验密度块输入基于UNet++网络模型构建的深度学习网络得到多个预测密度块;利用目标损失函数获取多个所述预测密度块与对应多个所述模拟密度块之间的差值,反向传播所述差值从而训练所述深度学习网络;其中,所述模拟密度图为所述实验密度块对应的无噪声的冷冻电镜图;所述目标损失函数包括平滑L1损失函数和结构相似性损失函数;S3:将当前冷冻电镜密度图切割为多个当前密度块,将所有的所述当前密度块输入训练好的深度学习网络,将输出的密度块进行组装得到最终密度图。2.如权利要求1所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S1包括:S11:从EMDB数据库和PDB数据库下载满足预设分辨率的单粒子冷冻电镜图以及与之关联的PDB结构作为初始样本;S12:对所述单粒子冷冻电镜图及其关联的PDB结构进行筛选和聚类,剔除不满足要求的初始样本;S13:将剩余的所述初始样本中的单粒子冷冻电镜图作为所述实验密度图,将每个所述实验密度图分割成多个预设尺寸的实验密度块。3.如权利要求2所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S12包括:S121:若一所述初始样本中的单粒子冷冻电镜图具有非正交的轴或分辨率不满足FSC
‑
0.143黄金标准或与之关联的PDB结构中仅包含骨架原子、包含未知的残基或包含缺失的链,则剔除所述初始样本;S122:若一所述初始样本中的PDB结构对应的CC_mask值低于预设值,则剔除所述初始样本;S123:使用贪心算法对剩余的所述初始样本中单粒子冷冻电镜图进行聚类得到多个集合,确定出各个集合中的代表样本,将所述代表样本中的单粒子冷冻电镜图作为所述训练样本。4.如权利要求3所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S123包括:若一所述初始样本中PDB结构内的任一条链与另一所述初始样本中PDB结构内任一条链有大于30%的序列相似性,则将两个初始样本放置到一个集合;将每个所述集合中相似样本数量最多的初始样本作为所述集合的所述代表样本,然后移除该集合中其余初始样本;将所述代表样本中的单粒子冷冻电镜图作为所述训练样本。5.如权利要求1所述的基于深度学习的冷冻电镜三维密度图后处理方法,其特征在于,所述S2之前,所述方法还包括:通过三次立方插值将各个所述实验密度图的网格间隔进行统一,负的密度值被截断到
零;采用全局归一化策略将每个所述实验密度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。