基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法技术

技术编号:27588901 阅读:17 留言:0更新日期:2021-03-10 10:05
一种基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法,通过计算冷冻电镜单颗粒图片集的图片相似性矩阵,从而生成KNN网络;采用局部线性嵌入算法对每幅冷冻电镜单颗粒图像进行降维,将KNN网络和图片特征矩阵输入图卷积自编解码器中的编码器,将高维的结点特征嵌入到低维的隐藏层空间中,得到低维的隐藏层结点特征后通过图卷积自编解码器中的解码器进行K

【技术实现步骤摘要】
基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法


[0001]本专利技术涉及的是一种图像处理领域的技术,具体是一种基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法。

技术介绍

[0002]冷冻电镜技术是一种把待检测大分子样本放入超低温环境中再使用电子显微镜进行观测的技术。对电子显微镜得到的二维图像进行重构即可得到生物大分子的三维模型。冷冻电镜单颗粒图像重构是最常用的一种冷冻电镜重构方法。在冷冻电镜的检测过程中,为了保证生物大分子的活性尽量不受电子辐射影响,电子显微镜使用的电子必须保证在一个很小的剂量下,因此冷冻电镜单颗粒图像的噪声很大,信噪比极低(通常低至以下),因而传统的聚类方法不太使用于冷冻电镜单颗粒图像聚类中。
[0003]目前现有的冷冻电镜单颗粒图像聚类算法大部分是基于图片间两两相似性进行度量的聚类算法,但是单颗粒图像间的相似性在低信噪比下很容易受到噪声影响,图片间的相似性可能被噪声而不是图片本身的类别特征所主导。

技术实现思路

[0001]本专利技术针对现有技术受噪声影响较大的缺陷,提出一种基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法,使用网络化的相似性度量方法和局部线性嵌入提取方法,结合自编码器的隐藏层结点特征同时学习到网络的结构信息和结点本身的图像特征信息,使得聚类的鲁棒性得到提升,显著提高了图像质量。
[0002]本专利技术是通过以下技术方案实现的:
[0003]本专利技术涉及一种基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法,通过计算冷冻电镜单颗粒图片集的图片相似性矩阵以生成K

最近邻法(KNN)网络;采用局部线性嵌入算法对每幅冷冻电镜单颗粒图像进行降维,将KNN网络和图片特征矩阵输入图卷积自编解码器中的编码器,将高维的结点特征嵌入到低维的隐藏层空间中,得到低维的隐藏层结点特征后通过图卷积自编解码器中的解码器进行K

means聚类处理得到冷冻电镜单颗粒图像的聚类结果,最后对每个聚类簇的图像取平均即可得到最终的类平均图像。
[0004]所述的图片相似性矩阵,采用协方差作为图片相似性度量准则,由冷冻电镜单颗粒图片集中所有单颗粒图片之间的协方差组成,具体为:粒图片集中所有单颗粒图片之间的协方差组成,具体为:其中:P,Q为单颗粒图像对应的一维向量,μ
P
和μ
Q
为图像P和图像Q对应的期望,因为在实际场景中无法获得图像的期望,因此用单颗粒图片集的平均向量μ来近似图像P和图像Q的期望向量。
[0005]所述的KNN网络,根据图片相似性矩阵计算每个结点的K近邻结点,并连接任两个互为K近邻的结点得到。
[0006]所述的降维是指:将冷冻电镜单颗粒图片集中每张N
×
N的冷冻电镜单颗粒二维图像展开成一维向量并组合得到图片矩阵,其中:M为单颗粒图片总数,然后通过局部线性嵌入算法对图片矩阵从原始的图片维度N2降至1000,得到图片特征矩阵
[0007]所述的编码器由两层的图卷积神经网络组成,每层图卷积进行以下处理:所述的编码器由两层的图卷积神经网络组成,每层图卷积进行以下处理:其中:A为原始输入的KNN网络的拉普拉斯矩阵,W
(l+1)
为网络的权值矩阵,H
(l)
为图卷积层的输入,H
(l+1)
为图卷积层的输出。
[0008]所述的解码器由内积函数解码器和两层逆图卷积神经网络组成,其中:内积函数解码器将低维结点特征重构为结点的邻接矩阵形式,学习结点间的关系信息;两层逆图卷积神经网络将低维的结点特征还原至输入的结点维度,学习结点的特征。
[0009]所述的内积函数解码器进行以下处理:A'=Sigmoid(H
(2)
H
(2)T
),其中:H
(2)
为图卷积自编码器的隐藏层结点特征,A'为内积函数解码器重构的网络。
[0010]所述的K

means聚类处理,采用但不限于基于欧式空间的K

means聚类方法。
[0011]本专利技术涉及一种实现上述方法的系统,包括:网络构建单元、结点特征获取单元、图卷积自编码器单元以及K

means聚类单元,其中:网络构建单元与图卷积自编码器单元相连并传输网络结构信息,结点特征获取单元与图卷积自编码器单元相连并传输结点特征信息,图卷积自编码器单元通过图卷积神经网络提取输入的图特征并以内积函数和逆图卷积神经网络作为解码器,同时学习输入网络的结构信息和输入结点的图像特征信息,得到低维结点特征并输出至K

means聚类单元,通过K

means聚类模块得到最终的聚类结果以及类平均图像。技术效果
[0012]本专利技术整体解决了现有技术无法处理高噪声的冷冻电镜单颗粒图像;与现有技术相比,本专利技术使用网络化作为相似性度量的方法,提升了相似性度量的鲁棒性,同时提出的适合于图像特征提取的图卷积自编码器方法,可以有效的提取网络的结构信息和结点的图像特征信息,进行二维聚类获取低噪声的类平均图像,提升了聚类结果。
附图说明
[0013]图1为基于图卷积自编码器的冷冻电镜单颗粒图像聚类算法流程图;
[0014]图2为GroEL真实冷冻电镜单颗粒图像样本示意图;
[0015]图3为GroEL真实结构示意图;
[0016]图4为基于本专利技术的聚类结果的类平均图像示意图;
[0017]图5为基于本专利技术的聚类类平均图像重构的初始模型结果示意图。
具体实施方式
[0018]本实施例中图卷积自编码器的编码层和解码层所使用的激活函数均为Sigmoid函数,优化器采用Adam优化器,内积解码器采用重构网络和输入网络的交叉熵作为损失函数,而逆图卷积解码器采用重构结点特征和输入结点特征的平方误差作为损失函数。图卷积编码器和逆图卷积编码器均为两层的图卷积神经网络,其中两层的神经个数分别设置为32,16。
[0019]如图2所示,为GroEL真实图像集中的GroEL蛋白的真实冷冻电镜单颗粒图像,该GroEL真实图像集为具有D7对称性的结构的4096张128
×
128的GroEL蛋白的冷冻电镜单颗粒图像。本实施例目标是将数据集中的单颗粒图像聚类到16个类别中,具体步骤包括:
[0020]第一步,采集单颗粒图像输入并将所有图像转换为一维向量,计算图像间的协方差,然后根据图片的协方差构建KNN网络。
[0021]第二步,使用局部线性嵌入算法对图像进行降维,降维后的特征即可作为第一步中的KNN网络的结点特征。
[0022]第三步,将前两步得到的KNN网络和结点特征输入到图卷积自编码器中,训练自编码器直至达到迭代步数上限。
[0023]第四步,使用K

means对图卷积自编码器的隐藏层特征进行聚类,并根据聚类结果对同一聚类簇的单颗粒图像求平均,得到最终的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法,其特征在于,通过计算冷冻电镜单颗粒图片集的图片相似性矩阵以生成KNN网络;采用局部线性嵌入算法对每幅冷冻电镜单颗粒图像进行降维,将KNN网络和图片特征矩阵输入图卷积自编解码器中的编码器,将高维的结点特征嵌入到低维的隐藏层空间中,得到低维的隐藏层结点特征后通过图卷积自编解码器中的解码器进行K

means聚类处理得到冷冻电镜单颗粒图像的聚类结果,最后对每个聚类簇的图像取平均即可得到最终的类平均图像;所述的编码器由两层的图卷积神经网络组成,每层图卷积进行以下处理:所述的编码器由两层的图卷积神经网络组成,每层图卷积进行以下处理:其中:A为原始输入的KNN网络的拉普拉斯矩阵,W
(l+1)
为网络的权值矩阵,H
(l)
为图卷积层的输入,H
(l+1)
为图卷积层的输出;所述的解码器由内积函数解码器和两层逆图卷积神经网络组成,其中:内积函数解码器将低维结点特征重构为结点的邻接矩阵形式,学习结点间的关系信息;两层逆图卷积神经网络将低维的结点特征还原至输入的结点维度,学习结点的特征。2.根据权利要求1所述的基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法,其特征是,所述的图片相似性矩阵,采用协方差作为图片相似性度量准则,由冷冻电镜单颗粒图片集中所有单颗粒图片之间的协方差组成,具体为:粒图片集中所有单颗粒图片之间的协方差组成,具体为:其中:P,Q为单颗粒图像对应的一维向量,μ
P
和μ
Q
为图像P和图像Q对应的期望,因为在实际场景中无法获得图像的期望,因此用单颗粒图片集的平均向量μ来近似图像P和图像Q的期望向量。3.根据权利要求1所述的基于图卷积自编码器的冷冻电镜单颗粒图像聚类实现方法...

【专利技术属性】
技术研发人员:蔡嘉鸣沈红斌
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1