【技术实现步骤摘要】
一种基于冷冻电镜数据构建单颗粒水平的能量曲面的方法
[0001]本专利技术提供一种设计机器学习算法通过冷冻电镜数据构建单颗粒水平的能量曲面的方法,属于数据科学与生物学的交叉领域。
技术介绍
[0002]冷冻电子显微镜技术是解析生物大分子及复合物结构的重要手段之一。纯化后的蛋白通过快速冷冻,分散在一层薄薄的冰层中,在电子显微镜下进行数据采集,得到各个单颗粒的二维投影,然后通过三维重构,得到三维结构的电子密度图。该技术可以在接近于天然的生理状态下,解析生物分子的高分辨结构,有助于研究复杂蛋白机器的工作机制。
[0003]生物分子通常具有内禀的柔性,所以生物分子的动态结构变化以及构象的异质性,一直是结构生物学的研究重点之一。在晶体状态下,生物分子的结构变化被晶格约束,一般只提供一个静态的结构和有限的动力学参数。冷冻电镜相比晶体学方法的优势在于可以捕捉生物分子在溶液中的各种状态,并记录不同构象下不同角度的投影。因此,冷冻电镜数据为生物分子的多构象解析提供了基础。在冷冻电镜数据处理领域中,现有的一些算法通过聚类分析、极大似然分 ...
【技术保护点】
【技术特征摘要】
1.一种基于冷冻电镜数据构建单颗粒水平的能量曲面的方法,其步骤包括:A. 将冷冻电镜图像数据分成若干组单颗粒图像,对每组单颗粒图像分别进行三维分类,重建生成一系列三维电子密度图数据集;B. 采用深度流形学习算法映射出三维电子密度图数据集的低维流形嵌入;C. 对于每个单颗粒图像,计算其与三维电子密度图对应角度投影图像的相似程度,是单颗粒图像指标,是像素点指标,实现方法为:C1. 取出每个单颗粒图像的角度信息,得到三维电子密度图在该角度上的投影图像;C2. 单颗粒图像与其对应的投影图像之间相似程度 的具体表达式定义为:式中,与 分别表示单颗粒图像与其对应的投影图像 的像素平均值;D. 使用整个单颗粒数据集对卷积神经网络进行训练,卷积神经网络用于学习单颗粒图像数据 的对应三维电子密度图的低维流形坐标,得到单颗粒图像的低维流形坐标映射,卷积神经网络的目标函数定义为相似程度加权的欧几里得距离:式中,权重是单颗粒图像 与对应的投影图像 的相似程度值; 是低维流形坐标的维度指标;E. 利用训练好的卷积神经网络预测每个单颗粒图像 在能量曲面上的坐标值,从而获得单颗粒水平...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。