【技术实现步骤摘要】
一种蛋白质冷冻电镜结构解析模型训练方法和解析方法
本专利技术涉及生物信息
,更具体地,涉及一种蛋白质冷冻电镜结构解析模型训练方法和解析方法。
技术介绍
冷冻电子显微镜技术,是在低温下对样品使用透射电子显微镜进行观察的显微技术。在生物大分子可视化领域,相比于广泛应用的X射线晶体衍射技术以及核磁共振技术,冷冻电镜技术不需要大量样品也无需分子结晶抑或同位素富集。因此冷冻电镜技术受到广泛关注且飞速发展,近年来越来越多的冷冻电镜图像被存放到EMDB(ElectronMicroscopyDataBank,电子显微镜数据库)中,图像的分辨率也不断提升。冷冻电镜技术的重大进展也催生了对电镜图像结构解释技术的迫切需求,其中包含了对蛋白质冷冻电镜图像进行主链建模的技术。对于一张蛋白质电子云密度图像,已知该蛋白质的氨基酸序列,主链建模技术可以通过建模得到序列上的每个氨基酸的Cα原子在图像中的对应位置,该技术的评估指标为真实位置与建模得到的预测位置的距离的平均值,即RMSD(均方误差),另外,由于即便知道图像中有哪些像素点是Cα原子的 ...
【技术保护点】
1.一种蛋白质冷冻电镜结构解析模型训练方法,其特征在于,包括:/n获取用于训练的蛋白质电子云密度图像;/n以所述蛋白质电子云密度图像中像素密度高于预设密度值的像素点为中心,按预设大小框选出子图像,并将所述子图像根据其中心是否为C
【技术特征摘要】
1.一种蛋白质冷冻电镜结构解析模型训练方法,其特征在于,包括:
获取用于训练的蛋白质电子云密度图像;
以所述蛋白质电子云密度图像中像素密度高于预设密度值的像素点为中心,按预设大小框选出子图像,并将所述子图像根据其中心是否为Cα位点分为正样本和负样本,所述Cα位点为已知的蛋白质中氨基酸Cα原子在所述蛋白质电子云密度图像的位点;
根据所述正样本和所述负样本对卷积神经网络模型进行训练,训练出Cα位点预测模型;
根据已知每个Cα位点的二级结构的所述正样本对卷积神经网络模型进行训练,训练出二级结构预测模型;
根据已知每个Cα位点的氨基酸类型的所述正样本对卷积神经网络模型进行训练,训练出氨基酸类型预测模型。
2.根据权利要求1所述的蛋白质冷冻电镜结构解析模型训练方法,其特征在于,所述卷积神经网络模型包括依次连接的卷积单元、全连接层和损失函数层,卷积单元包括多个依次连接的卷积层。
3.根据权利要求2所述的蛋白质冷冻电镜结构解析模型训练方法,其特征在于,每个所述卷积层之间还连接有批标准化层和/或非线性激活层。
4.根据权利要求1至3任一项所述的蛋白质冷冻电镜结构解析模型训练方法,其特征在于,根据所述正样本和所述负样本对卷积神经网络模型进行训练,训练出Cα位点预测模型,具体为:
对于不同分辨率的所述蛋白质电子云密度图像,根据所述正样本和所述负样本对卷积神经网络模型进行不同的训练,训练出对应不同分辨率的Cα位点预测模型;
根据已知每个Cα位点的二级结构的所述正样本对卷积神经网络模型进行训练,训练出二级结构预测模型,具体为:
对于不同分辨率的所述蛋白质电子云密度图像,根据已知每个Cα位点的二级结构的所述正样本对卷积神经网络模型进行不同的训练,训练出对应不同分辨率的二级结构预测模型;
根据已知每个Cα位点的氨基酸类型的所述正样本对卷积神经网络模型进行训练,训练出氨基酸类型预测模型,具体为:
对于不同分辨率的所述蛋白质电子云密度图像,根据已知每个Cα位点的氨基酸类型的所述正样本对卷积神经网络模型进行不同的训练,训练出对应不同分辨率的氨基酸类型预测模型。
5.根据权利要求1至3任一项所述的蛋白质冷冻电镜结构解析模型训练方法,其特征在于,根据所述正样本和所述负样本,训练出Cα位点预测模型之前,还包括:
在所述负样本中排除邻居样本,所述邻居样本为其中心点像素坐标值与某个或某些所述正样本的中心点像素坐标值之差的绝对值小于预设差值的所述负样本。
6.一种蛋白质冷冻电镜结构解析方法,其特征在于,采用如权利要求1至6任一项所述的Cα位点预测模型、二级结构预测模型和氨基酸类型预测模型,包括:
获取待预测蛋白质电子云密度图像;
以所述待预测蛋白质电子云密度图像中像素密度高于预设密度值的像素点为中心,按预设大小框选出待测子图像;
将所述待测子图像输入所述Cα位点预测模型,预测得到Cα位点,所述Cα位点为蛋白质中氨基酸Cα原子在所述蛋白质电子云密度图像的位点;
将其中心为Cα位点的所述待测子图像分别输入所述二级结构预测模型和所述氨基酸类型预测模型,预测得到每个所述Cα...
【专利技术属性】
技术研发人员:杨跃东,陈晟,李雄俊,卢宇彤,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。