【技术实现步骤摘要】
一种面向单颗粒冷冻电镜图像的深度聚类方法
本专利技术属于机器学习领域,特别涉及一种面向单颗粒冷冻电镜图像的深度聚类方法。
技术介绍
冷冻电镜技术作为高分辨率结构生物学研究的基础技术,是近年最为热门的结构生物学研究手段。经过多年的发展,冷冻电镜技术近年来取得了突破性进步,已经能够作为研究生物大分子结构与功能的有效手段。二维颗粒图像的分类是获取三维结构的重要一步,其主要目标是消除颗粒图像旋转和平移的误差,遵从类内紧致、类间离散的原则对图像进行分类,最终对同属一类的颗粒图像进行逐像素平均。这样分类的结果不仅可以提高信噪比,而且能够提高三维模型的分辨率。如果忽略大分子的构象不同,投影图像之间的内在差异主要来自两个来源:投影方向和平面内旋转。在分类之前必须对齐颗粒图像,以最小化它们因为平移和平面内旋转造成的差异。一般用于2D颗粒投影图像的初始分类有两种流行的方法,即多模板对齐法(multi-referencealignment,MRA)和无模板对齐法(reference-freealignment,RFA)。在MRA中,重复执行2D图像对准步骤和聚类步骤直到收敛。在2D图像 ...
【技术保护点】
1.一种面向单颗粒冷冻电镜图像的深度聚类方法,其特征在于,包括以下步骤:第一步,数据预处理,并将数据送入自编码器进行预训练;第二步,训练自编码器;第三步,将要进行聚类的所有颗粒图像数据输入自编码器,用编码器的输出作为图像特征进行聚类,得到聚类结果并分析聚类准确率,判断损失函数是否开始小幅波动或者聚类准确率变化是否小于阈值,如果小于阈值,输出聚类结果,结束;否则,转第二步。
【技术特征摘要】
1.一种面向单颗粒冷冻电镜图像的深度聚类方法,其特征在于,包括以下步骤:第一步,数据预处理,并将数据送入自编码器进行预训练;第二步,训练自编码器;第三步,将要进行聚类的所有颗粒图像数据输入自编码器,用编码器的输出作为图像特征进行聚类,得到聚类结果并分析聚类准确率,判断损失函数是否开始小幅波动或者聚类准确率变化是否小于阈值,如果小于阈值,输出聚类结果,结束;否则,转第二步。2.如权利要求1所述的面向单颗粒冷冻电镜图像的深度聚类方法,其特征在于,所述第一步具体包括以下步骤:1.1构建基于卷积神经网络的自编码器,简称自编码器,自编码器包含编码器和解码器,其中编码器依次包含输入层、两个卷积层、输出层;解码器以编码器的输出层为输入层,依次包含两个反卷积层和输出层;1.2对图像进行预处理,得到预处理后的颗粒图像;1.3将预处理后的颗粒图像作为输入图像,以每P张图像作为一个批次,输入到自编码器中,以解码器的输出结果和输入图像之间的均方误差作为损失函数掩码器,数据集循环训练次数设置为C,C为自然数,用随机梯度下降方法训练自编码器;P为整数,一般为2的幂次。3.如权利要求1所述的面向单颗粒冷冻电镜图像的深度聚类方法,其特征在于,所述第二步具体包括以下步骤:2.1从预处理后的颗粒图像中取Q张作为一个批次,对预训练自编码器中编码器的输出向量特征聚类,即将编码器的输出层作为颗粒图像特征进行聚类,得到这一批图像的初始聚类结果;Q为整数,一般为2的幂次;2.2计算与初始聚类结果相关的聚类损失函数Lc和验证损失函数Lv,并计算网络的损失函数;聚类损失函数计算过程包含三部分:(1)当前聚类结果的分布p;(2)辅助目标函数q;(3)p与q之间的KL散度;其中p的计算公式为(1):其中zi是第i个数据点经过自编码器得到的输出,0≤i<N,α是t分布的自由度,一般取1,pij是数据i指派到聚类中心j的概率,μj是上一次迭代得到的聚类中心j的向量,μj′是任意聚类中心j′的向量;M是聚类...
【专利技术属性】
技术研发人员:葛可适,邵旭颖,李东升,苏华友,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。