蛋白质模型质量评估方法、装置及计算机设备制造方法及图纸

技术编号:37206902 阅读:21 留言:0更新日期:2023-04-20 22:59
本申请公开了一种蛋白质模型质量评估方法、装置及计算机设备。方法通过获取目标蛋白质模型的坐标信息以及化学键信息,目标蛋白质模型包括多个氨基酸残基,坐标信息包括每一氨基酸残基中每一原子的坐标信息,化学键信息包括目标蛋白质模型中原子之间的化学键信息;根据每一原子的坐标信息、每一原子的原子类型信息以及每一原子所属的氨基酸残基的氨基酸类型信息提取每一原子的几何特征;基于原子之间的化学键信息提取每一原子的拓扑特征;将每一原子的几何特征与对应的拓扑特征进行融合,得到每一原子的融合特征;基于每一原子的融合特征确定目标蛋白质模型中每一原子对应的模型质量分数。该方法可以提升蛋白质模型质量评估的准确性。的准确性。的准确性。

【技术实现步骤摘要】
蛋白质模型质量评估方法、装置及计算机设备


[0001]本申请涉及生物
,具体涉及一种蛋白质模型质量评估方法、装置及计算机设备。

技术介绍

[0002]蛋白质的结构对于研究蛋白质功能、开发药物有着重要的作用。目前,对蛋白质的结构的确定一般采用实验来观察确定蛋白质的结构。
[0003]然而,利用实验来观察蛋白质的结构需要耗费大量的时间和成本,因此越来越多的研究开始关注使用计算的方法来进行蛋白质结构预测,即从蛋白质的序列来预测蛋白质的三维结构。其中,蛋白质模型质量评估(Protein Quality Assessment,Protein QA)是蛋白质结构预测流程中的一个关键步骤,用于评估候选蛋白质模型的准确性。Protein QA评估预测结构相对于参考结构的差异,从而帮助其下游任务选择最佳模型结构并根据估计的质量分数改进蛋白质模型。
[0004]然而,目前对蛋白质模型质量进行评估的方法评估得到的蛋白质模型质量的准确性较低。

技术实现思路

[0005]本申请实施例提供一种蛋白质模型质量评估方法、装置及计算机设备,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种蛋白质模型质量评估方法,其特征在于,所述方法包括:获取目标蛋白质模型的坐标信息以及化学键信息,所述目标蛋白质模型包括多个氨基酸残基,所述坐标信息包括每一所述氨基酸残基中每一原子的坐标信息,所述化学键信息包括所述目标蛋白质模型中原子之间的化学键信息;根据所述每一原子的坐标信息、每一原子的原子类型信息以及每一原子所属的氨基酸残基的氨基酸类型信息提取每一原子的几何特征;基于所述原子之间的化学键信息提取每一原子的拓扑特征;将每一原子的几何特征与对应的拓扑特征进行融合,得到每一原子的融合特征;基于所述每一原子的融合特征确定所述目标蛋白质模型中每一原子对应的模型质量分数。2.根据权利要求1所述的方法,其特征在于,所述根据所述每一原子的坐标信息、每一原子的原子类型信息以及每一原子所属的氨基酸残基的氨基酸类型信息提取每一原子的几何特征,包括:获取每一原子的原子类型信息以及每一原子所属的氨基酸残基的氨基酸类型信息,得到每一原子的属性特征;对每一原子的坐标信息以及属性特征进行体素转化,得到每一原子的体素特征,所述体素特征包括体素坐标特征以及体素属性特征;将每一原子的体素特征输入至预设卷积神经网络模型中,得到每一原子的几何特征。3.根据权利要求2所述的方法,其特征在于,所述将每一原子的体素特征输入至预设卷积神经网络模型中,得到每一原子的几何特征之前,还包括:获取训练样本数据,所述训练样本数据包括多个样本蛋白质模型的坐标信息以及化学键信息;根据每一样本蛋白质模型的坐标信息确定每一样本蛋白质模型中每一样本原子的样本体素特征;获取每一样本蛋白质模型中每一样本原子对应的标签值;以每一样本蛋白质模型中每一样本原子的样本体素特征为输入,以样本原子对应的标签值为输出训练预设卷积神经网络模型。4.根据权利要求3所述的方法,其特征在于,所述获取每一样本蛋白质模型中每一样本原子对应的标签值,包括:获取每一样本蛋白质模型对应的参考蛋白质模型;计算每一样本蛋白质模型中每一样本原子与对应参考蛋白质模型中对应原子之间的相似系数,得到每一样本蛋白质模型中每一样本原子对应的标签值。5.根据权利要求4所述的方法,其特征在于,所述计算每一样本蛋白质模型中每一样本原子与对应参考蛋白质模型中对应原子之间的相似系数,得到每一样本蛋白质模型中每一样本原子对应的标签值,包括:获取目标样本蛋白质模型中目标样本原子在预设邻域半径范围内的相邻原子的原子序号信息,并计算所述目标样本原子与每一相邻原子之间的距离,得到第一距离信息;根据所述原子序号信息在所述目标样本蛋白质模型对应的参考蛋白质模型中确定参考相邻原子,并计算所述目标样本原子对应的目标参考样本原子与每一参考相邻原子之间
的距离,得到第二距离信息;采用预设映射函数对所述第一距离信息与所述第二距离信息之差进行映射处理,得到所述目标样本蛋白质模型中目标样本原子对应的标签值;遍历每一样本蛋白质模型中每一样本原子,计算得到每一样本蛋白质模型中每一样本原子对应的标签值。6.根据权利要求3所述的方法,其特征在于,所述以每一样本蛋白质模型中每一样本原子的样本体素特征为输入,以样本原子对应的标签值为输出训练预设卷积神经网络模型,包括:将每一样本蛋白质模型中每一样本原子的样本体素特征输入至预设卷积神经网络模型中,得到所述预设卷积神经网络模型输出的每一样本原子对应的输出体素特征;对每一样本原子对应的输出体素特征进行去体素化处理,得到每一样本原子的输出分数值;基于每一样本原子的输出分数值与每一样本原子对应的标签值之间的差值对所述预设卷积神经网络模型中的模型参数进行调节,直至所述预设卷积神经网络模型收敛。7.根据权利要求2所述的方法,其特征在于,所述对每一原子的坐标信...

【专利技术属性】
技术研发人员:李镇王晟陆盈枫颜旭郑良振林明智崔曙光
申请(专利权)人:香港中文大学深圳未来智联网络研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1