当前位置: 首页 > 专利查询>清华大学专利>正文

一种冷冻电镜三维重构中重构参数搜索方法和系统技术方案

技术编号:18896397 阅读:29 留言:0更新日期:2018-09-08 11:52
本发明专利技术提供一种冷冻电镜三维重构中重构参数搜索方法和系统,所述方法包括:构建高维参数空间,对每一张实验照片,通过蒙特卡洛模拟方法在所述参数空间中进行随机采样,计算实验照片在每个采样点上与给定模型的似然度;对似然度大于设定条件的采样点进行重采样,产生新的随机采样点,并计算相应的似然度;重复此重采样过程,直至所有采样点收敛至具有最大似然度的采样点附近;将收敛后的一系列采样点的统计分布参数作为对该实验照片的重构参数的一种统计描述,并用于重构生物大分子的三维电子密度图。能对每个生物大分子颗粒成像的离焦量参数进行单独地精确测定,能大幅提高生物大分子的三维重构分辨率。

A search method and system for reconstruction parameters in 3D reconstruction of cryo electron microscope

The invention provides a method and a system for searching reconstruction parameters in three-dimensional reconstruction of cryo-electron microscopy. The method comprises constructing a high-dimensional parameter space, randomly sampling each experimental photograph in the parameter space by Monte Carlo simulation method, and calculating the likelihood of the experimental photograph at each sampling point with the given model. Degree of likelihood; resampling the sampling points whose likelihood is greater than the set condition, generating a new random sampling point and calculating the corresponding likelihood; repeating the resampling process until all the sampling points converge to the sampling points with the maximum likelihood; taking a series of statistical distribution parameters of the convergent sampling points as the experimental data A statistical description of the reconstructed parameters of photographs and used to reconstruct three-dimensional electron density maps of biological macromolecules. The defocus parameters of each biomacromolecule can be measured accurately and separately, which can greatly improve the three-dimensional reconstruction resolution of biomacromolecule.

【技术实现步骤摘要】
一种冷冻电镜三维重构中重构参数搜索方法和系统
本专利技术涉及结构生物学
,更具体地,涉及一种冷冻电镜三维重构中重构参数搜索方法和系统。
技术介绍
在低温下使用透射电子显微镜观察样品的显微技术,就叫做冷冻电子显微学技术(cryo-electronmicroscopy,cryo-EM),简称冷冻电镜技术。冷冻电镜技术是重要的结构生物学研究方法,它与另外两种技术:X射线晶体学(X-raycrystallography)和核磁共振(nuclearmagneticresonance,NMR)一起构成了高分辨率结构生物学研究的基础,在获得生物大分子的结构并揭示其功能方面极为重要。冷冻电镜技术的基本原理就是把样品冻起来然后保持低温放进显微镜里面,利用相干的电子束作为光源对生物样品进行观察,透过样品和附近的冰层后,透镜系统把电子散射信号转换为放大的图像在探测器上记录下来,最后进行图像信号处理,得到样品的三维结构。单颗粒冷冻电镜三维重构技术是把冷冻电子显微镜拍摄的一系列随机取向的具有均一结构的生物大分子的照片,通过一套三维重构的算法来计算出其高分辨率三维结构。重构出来的三维结构揭示了生物大分子中原子的排列方式以及相互作用的模式。通过对结构的分析,可以解释相关的生物功能和内在机制,对理解生命的基本原理,疾病的分子机理以及药物设计等具有重要意义。三维重构需要首先获得围绕着样品从各个不同的方向角度来拍摄的照片,然后才能重构出样品的三维结构。由于每个蛋白质拍摄的角度不可控,三维重构算法包含两个部分,第一部分是计算出每张照片的三维空间取向等三维重构所需的参数,称为重构参数,第二部分是根据计算出来的重构参数进行三维重构。描述一张照片的三维空间取向需要多个参数,包括两个面内平移参数,三个空间取向角参数,分类参数以及成像相关的参数等等。精确测定这些重构参数,是决定最终三维重构分辨率的决定性因素。然而,因为照片的数量非常庞大,通常在几万到几十万的数量级,这也就意味着有数以百万甚至千万级的参数需要被精确测定。同时,在用于重构的照片里,经常会掺杂很多低质量甚至是杂质的照片,对重构测量参数的测量造成了干扰,经常会影响结构测定的最终分辨率。因此,如何精确测定这些参数,并且评估每个测定参数的准确度,是一个非常重要的问题。用于三维重构的每张照片的取向等参数可以被认为分布在一个多维参数空间里,每一个参数对应一个维度。如上所述,目前的三维重构参数空间至少有5个维度,包括2个平移和3个空间取向角。如果考虑成像参数等,就需要增加到更高的维度。基于这样的多维空间描述方法,目前人们已经在冷冻电镜三维重构中引入了多种参数搜索的方法。其中最常用的是网格搜索的方法,其基本原理是在给定的参数搜索范围里,按照一个固定的步长,对所有可能的参数逐个进行尝试,最后找到可能性最大的参数作为搜索结果;这种方法的最大缺点是计算量随着搜索精度的提高,运算量呈指数增加;例如,在一个5维空间里,每个空间搜索10次,那么总的搜索量为105次。如果把搜索精度提高1倍,每个维度搜索20次,那么计算量就变为原先的25=64倍。一个变通的方法是先用比较粗的网格搜索,然后确定一个粗略的参数范围,然后再在这个小范围内做更加精细的搜索。无论那种网格搜索算法都强烈依赖于参数搜索的精度,而且需要借助一些先验的知识来确定起始的搜索补偿。还有一种搜索方法是基于梯度下降的方法,这种方法通过估计起始点附近梯度的变化来确定搜索方向,可以使用较少的搜索量就能快速找到最优的参数,因此,相对于网格搜索方法,其最大优点是速度快,但这个方法只能解决局部最优问题,仅能进行局部搜索。而且梯度方法随着维度的增加,搜索可靠性显著下降。网格结合梯度下降的方法也经常被采用,利用覆盖全局参数空间的粗网格做全局搜索,然后利用梯度下降的办法做局部精确搜索,但是无论是网格搜索还是梯度搜索,都无法对每一个参数的搜索可靠性做出评估。
技术实现思路
本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种冷冻电镜三维重构中重构参数搜索方法和系统,解决了现有技术中无法空间参数搜索速度慢,可靠性低,且无法对每一个参数的搜索可靠性做出评估的问题。根据本专利技术的一个方面,提供一种冷冻电镜三维重构中重构参数搜索方法,包括:构建参数空间,对每一张实验照片,通过蒙特卡洛模拟方法在所述参数空间中进行随机采样,计算实验照片在每个采样点上与给定模型的初始似然度;对初始似然度大于设定条件的采样点进行重采样,产生新的采样点,并计算相应的似然度;重复所述重采样过程,直至所有采样点的分布均方差不再减小;将收敛后的采样点的统计分布参数作为对该实验照片的重构参数的一种统计描述,并用于重构生物大分子的三维电子密度图。作为优选的,构建参数空间具体包括:构建平移子空间,将所述平移子空间通过x和y两个平移参数描述;构建旋转子空间,将所述旋转子空间通过一个单位四元数q描述;构建离焦量子空间,将所述离焦量子空间通过一个离焦量的变化比例系数ζ描述;构建结构状态子空间,将所述结构状态子空间通过一个描述所属结构状态的整数编号μ来描述;将所述平移子空间、旋转子空间、离焦量子空间和结构状态子空间组合成参数空间{x,y,q,ζ,μ}。作为优选的,获取每个采样点与实验照片的似然度具体包括:将三维参照物按采样点的参数进行投影,计算投影和实验照片间的似然度。作为优选的,对似然度大于设定条件的投影对应的采样点进行重采样具体包括:将所述似然度作为采样点的权重,根据权重对采样点进行高低排序,将排序靠前的N个采样点进行重采样,即以每个原采样点为中心重新产生多个采样点,排在后面的权重较低的采样点将被去掉,保证采样点总数在重采样前后的总数不变。作为优选的,对似然度大于设定条件的采样点进行重采样后还包括:每次采样结束后,对采样点分布情况进行统计,基于所述采样点分布均方差进行下一轮重采样。作为优选的,直至所有采样点的分布均方差不再减小具包括:使所有采样点的似然度收敛,若重采样无法使采样点收敛到更小的区域,则使所有采样点收敛至具有最大似然度的采样点附近。一种冷冻电镜三维重构中空间参数搜索系统,包括:采样模块,用于对每一张实验照片,通过蒙特卡洛模拟方法在参数空间中进行随机采样,得到多个采样点;搜索模块,用于基于每个采样点的参数对三维参照物体进行投影,获取每个投影与实验照片的似然度;循环模块,用于对似然度大于设定条件的投影对应的采样点,像所述采样模块发送重采样指令,并在所有采样点收敛至具有最大似然度的投影对应的采样点时,发送停止采样指令。重构模块,用于根据采样点所反映出的重构参数信息进行三维重构,把采样点分布均方差的倒数作为权重,随机选取N个或全部采样点按此权重参与三维重构。作为优选的,还包括置信度模块,所述置信度模块用于在每一轮采样结束后,统计采样点在参数空间的分布情况,并计算采样点在参数空间分布的均方差。作为优选的,还包括权重计算模块,所述权重计算模块用于在所有采样点收敛至具有最大似然度的投影对应的采样点后,计算所述采样点分布的均方差的倒数,并进行归一化处理,将所述倒数作为对应实验照片的权重。本专利技术提出一种冷冻电镜三维重构中重构参数搜索方法和系统,在冷冻电镜三维重构中使用粒子滤波类的重点采样算法来估计参数,基于随机采样本文档来自技高网
...

【技术保护点】
1.一种冷冻电镜三维重构中重构参数搜索方法,其特征在于,包括:构建参数空间,对每一张实验照片,通过蒙特卡洛模拟方法在所述参数空间中进行随机采样,计算实验照片在每个采样点上与给定模型的初始似然度;对初始似然度大于设定条件的采样点进行重采样,产生新的采样点,并计算相应的似然度;重复所述重采样过程,直至所有采样点的分布均方差不再减小;将收敛后的采样点的统计分布参数作为对该实验照片的重构参数的一种统计描述,并用于重构生物大分子的三维电子密度图。

【技术特征摘要】
1.一种冷冻电镜三维重构中重构参数搜索方法,其特征在于,包括:构建参数空间,对每一张实验照片,通过蒙特卡洛模拟方法在所述参数空间中进行随机采样,计算实验照片在每个采样点上与给定模型的初始似然度;对初始似然度大于设定条件的采样点进行重采样,产生新的采样点,并计算相应的似然度;重复所述重采样过程,直至所有采样点的分布均方差不再减小;将收敛后的采样点的统计分布参数作为对该实验照片的重构参数的一种统计描述,并用于重构生物大分子的三维电子密度图。2.根据权利要求1所述的方法,其特征在于,构建参数空间具体包括:构建平移子空间,将所述平移子空间通过x和y两个平移参数描述;构建旋转子空间,将所述旋转子空间通过一个单位四元数q描述;构建离焦量子空间,将所述离焦量子空间通过一个离焦量的变化比例系数ζ描述;构建结构状态子空间,将所述结构状态子空间通过一个描述所属结构状态的整数编号μ来描述;将所述平移子空间、旋转子空间、离焦量子空间和结构状态子空间组合成参数空间{x,y,q,ζ,μ}。3.根据权利要求1所述的方法,其特征在于,获取实验照片在每个采样点上与给定模型的似然度具体包括:将给定三维参照物按采样点的参数进行投影,计算投影和实验照片间的似然度。4.根据权利要求1所述的方法,其特征在于,对似然度大于设定条件的采样点进行重采样具体包括:将所述似然度作为采样点的权重,根据权重对采样点进行高低排序,将排序靠前的N个采样点作为原采样点进行重采样,以每个原采样点为中心重新获取多个采样点,且重采样后的采样点总数与重采样前的采样点总数相同。5.根据权利要求1所述的方法,其特征在于,对似然度大于设定条件的采样点进行重采样后还包括:每次采样结束后,对采样点...

【专利技术属性】
技术研发人员:李雪明胡名旭沈渊余洪坤杨广文顾凯
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1