蛋白质折叠方式的确定方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36877221 阅读:22 留言:0更新日期:2023-03-15 20:46
本公开涉及计算机和生物学领域,尤其涉及一种蛋白质折叠方式的确定方法、装置、电子设备和存储介质,确定目标蛋白质对应的氨基酸序列以及电子密度图,氨基酸序列中包括至少两个氨基酸。根据电子密度图确定至少一个支撑点,根据每两个支撑点之间的位置关系确定支撑点对表示矩阵,根据支撑点的数量和氨基酸序列中氨基酸数量确定支撑点

【技术实现步骤摘要】
蛋白质折叠方式的确定方法、装置、电子设备和存储介质


[0001]本公开涉及计算机和生物学领域,尤其涉及一种蛋白质折叠方式的确定方法、装置、电子设备和存储介质。

技术介绍

[0002]蛋白质折叠问题是目前生物学领域最重要的基础问题之一,用于研究蛋白质的氨基酸序列与蛋白质结构之间的关系。随着人工智能技术的迅速发展,近年来出现了通过人工智能算法根据氨基酸序列自动预测蛋白质空间折叠结构的方法,但人工智能算法预测得到的蛋白质结构仍有局限,对特定构象的蛋白质准确率较低,还需要依赖人工对蛋白质结构进行判断和纠正,在应用过程中具有一定的局限性。

技术实现思路

[0003]有鉴于此,本公开提出了一种蛋白质折叠方式的确定方法、装置、电子设备和存储介质,旨在提高通过人工智能算法预测蛋白质折叠方式的准确性。
[0004]根据本公开的第一方面,提供了一种蛋白质折叠方式的确定方法,所述方法包括:
[0005]确定目标蛋白质对应的氨基酸序列以及电子密度图,所述氨基酸序列中包括至少两个按顺序排列的氨基酸;
[0006]根据所述电子密度图确定至少一个支撑点;
[0007]根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵;
[0008]根据所述支撑点的数量和所述氨基酸序列中包括的氨基酸数量确定支撑点

残基对表示矩阵;
[0009]根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式。
[0010]在一种可能的实现方式中,所述根据所述电子密度图确定至少一个支撑点,包括:
[0011]确定所述电子密度图中每个像素点属于蛋白质主链的概率值;
[0012]根据每个所述像素点对应的概率值,以及每两个所述像素点之间的距离筛选得到至少一个像素点作为支撑点。
[0013]在一种可能的实现方式中,所述根据每个所述像素点对应的概率值,以及每两个所述像素点之间的距离筛选得到至少一个像素点作为支撑点,包括:
[0014]确定对应概率值最高的第一预设数量个像素点作为候选点;
[0015]以迭代方式对所述候选点执行以下步骤,直到得到第二预设数量个候选点作为支撑点:
[0016]确定每两个所述候选点之间的距离;
[0017]删除对应距离最小的两个所述候选点中概率值低的候选点。
[0018]在一种可能的实现方式中,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,包括:
[0019]确定每两个所述支撑点组成的有序支撑点对;
[0020]根据每个所述有序支撑点对中两个支撑点的位置确定对应的方向特征向量;
[0021]根据每个所述有序支撑点对中两个支撑点之间的距离确定对应的距离特征向量;
[0022]根据每个所述有序支撑点对对应的距离特征向量和方向特征向量确定支撑点对表示矩阵,所述支撑点对表示矩阵的每行和每列均表征一个对应的支撑点,每个元素表征所在行对应支撑点与所在列对应支撑点之间的位置关系。
[0023]在一种可能的实现方式中,所述根据每个所述有序支撑点对中两个支撑点的位置确定对应的方向特征向量,包括:
[0024]对于每个所述有序支撑点对,计算其中一个支撑点与另一个支撑点的位置之差,得到相对位置向量;
[0025]计算所述相对位置向量与所述相对位置向量的模长之比,得到所述有序支撑点对的方向特征向量。
[0026]在一种可能的实现方式中,所述根据每个所述有序支撑点对中两个支撑点之间的距离确定对应的距离特征向量,包括:
[0027]确定第三预设数量个维度的空白向量,其中每个所述维度位置具有对应的预设距离区间;
[0028]对于每个所述有序支撑点对,计算其中两个所述支撑点之间的距离;
[0029]将所述空白向量中所述距离所在的预设距离区间对应维度位置值修改为1,其他维度位置值修改为0得到对应的距离特征向量。
[0030]在一种可能的实现方式中,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,还包括:
[0031]对所述支撑点进行均值归一化处理。
[0032]在一种可能的实现方式中,所述对所述支撑点进行均值归一化处理,包括:
[0033]计算每个所述支撑点的坐标均值;
[0034]计算每个所述支撑点的坐标与所述坐标均值的差值,并将所述差值更新为所述支撑点的坐标。
[0035]在一种可能的实现方式中,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,还包括:
[0036]随机确定旋转矩阵,并通过所述旋转矩阵与每个所述支撑点坐标矩阵相乘旋转每个所述支撑点。
[0037]在一种可能的实现方式中,所述有序支撑点对中包括第一支撑点和第二支撑点,所述根据每个所述有序支撑点对对应的距离特征向量和方向特征向量确定支撑点对表示矩阵,包括:
[0038]根据每个所述有序支撑点对的距离特征向量和所述方向特征向量确定位置关系向量;
[0039]确定每行和每列均表征一个对应的支撑点的第一矩阵;
[0040]将每个所述有序支撑点对对应位置关系向量填充至所述第一矩阵中第一支撑点所在列,第二支撑点所在行对应的坐标位置,得到支撑点对表示矩阵。
[0041]在一种可能的实现方式中,所述根据所述支撑点数量和所述氨基酸序列中包括的
氨基酸数量确定支撑点

残基对表示矩阵,包括:
[0042]确定每行表征一个氨基酸,每列表征一个支撑点的第二矩阵;
[0043]在所述第二矩阵内每个坐标位置中随机生成通道数量与所述支撑点对表示矩阵相同的向量,得到支撑点

残基对表示矩阵。
[0044]在一种可能的实现方式中,所述根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式,包括:
[0045]通过训练得到的折叠方式预测模型根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式。
[0046]在一种可能的实现方式中,所述折叠方式预测模型包括前处理层、循环更新层和结构预测层,所述通过训练得到的折叠方式预测模型根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式,包括:
[0047]将所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵输入所述折叠方式预测模型中,通过所述前处理层对所述氨基酸序列进行处理得到多序列对比表示矩阵和残基对表示矩阵;
[0048]通过所述循环更新层对所述多序列对比表示矩阵、所述残基对表示矩阵、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵进行至少一次循环更新;
[0049]通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蛋白质折叠方式的确定方法,其特征在于,所述方法包括:确定目标蛋白质对应的氨基酸序列以及电子密度图,所述氨基酸序列中包括至少两个按顺序排列的氨基酸;根据所述电子密度图确定至少一个支撑点;根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵;根据所述支撑点的数量和所述氨基酸序列中包括的氨基酸数量确定支撑点

残基对表示矩阵;根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式。2.根据权利要求1所述的方法,其特征在于,所述根据所述电子密度图确定至少一个支撑点,包括:确定所述电子密度图中每个像素点属于蛋白质主链的概率值;根据每个所述像素点对应的概率值,以及每两个所述像素点之间的距离筛选得到至少一个像素点作为支撑点。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述像素点对应的概率值,以及每两个所述像素点之间的距离筛选得到至少一个像素点作为支撑点,包括:确定对应概率值最高的第一预设数量个像素点作为候选点;以迭代方式对所述候选点执行以下步骤,直到得到第二预设数量个候选点作为支撑点:确定每两个所述候选点之间的距离;删除对应距离最小的两个所述候选点中概率值低的候选点。4.根据权利要求1所述的方法,其特征在于,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,包括:确定每两个所述支撑点组成的有序支撑点对;根据每个所述有序支撑点对中两个支撑点的位置确定对应的方向特征向量;根据每个所述有序支撑点对中两个支撑点之间的距离确定对应的距离特征向量;根据每个所述有序支撑点对对应的距离特征向量和方向特征向量确定支撑点对表示矩阵,所述支撑点对表示矩阵的每行和每列均表征一个对应的支撑点,每个元素表征所在行对应支撑点与所在列对应支撑点之间的位置关系。5.根据权利要求4所述的方法,其特征在于,所述根据每个所述有序支撑点对中两个支撑点的位置确定对应的方向特征向量,包括:对于每个所述有序支撑点对,计算其中一个支撑点与另一个支撑点的位置之差,得到相对位置向量;计算所述相对位置向量与所述相对位置向量的模长之比,得到所述有序支撑点对的方向特征向量。6.根据权利要求4所述的方法,其特征在于,所述根据每个所述有序支撑点对中两个支撑点之间的距离确定对应的距离特征向量,包括:确定第三预设数量个维度的空白向量,其中每个所述维度位置具有对应的预设距离区间;
对于每个所述有序支撑点对,计算其中两个所述支撑点之间的距离;将所述空白向量中所述距离所在的预设距离区间对应维度位置值修改为1,其他维度位置值修改为0得到对应的距离特征向量。7.根据权利要求4所述的方法,其特征在于,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,还包括:对所述支撑点进行均值归一化处理。8.根据权利要求7所述的方法,其特征在于,所述对所述支撑点进行均值归一化处理,包括:计算每个所述支撑点的坐标均值;计算每个所述支撑点的坐标与所述坐标均值的差值,并将所述差值更新为所述支撑点的坐标。9.根据权利要求4所述的方法,其特征在于,所述根据每两个所述支撑点之间的位置关系确定支撑点对表示矩阵,还包括:随机确定旋转矩阵,并通过所述旋转矩阵与每个所述支撑点坐标矩阵相乘旋转每个所述支撑点。10.根据权利要求4所述的方法,其特征在于,所述有序支撑点对中包括第一支撑点和第二支撑点,所述根据每个所述有序支撑点对对应的距离特征向量和方向特征向量确定支撑点对表示矩阵,包括:根据每个所述有序支撑点对的距离特征向量和所述方向特征向量确定位置关系向量;确定每行和每列均表征一个对应的支撑点的第一矩阵;将每个所述有序支撑点对对应位置关系向量填充至所述第一矩阵中第一支撑点所在列,第二支撑点所在行对应的坐标位置,得到支撑点对表示矩阵。11.根据权利要求1所述的方法,其特征在于,所述根据所述支撑点数量和所述氨基酸序列中包括的氨基酸数量确定支撑点

残基对表示矩阵,包括:确定每行表征一个氨基酸,每列表征一个支撑点的第二矩阵;在所述第二矩阵内每个坐标位置中随机生成通道数量与所述支撑点对表示矩阵相同的向量,得到支撑点

残基对表示矩阵。12.根据权利要求1所述的方法,其特征在于,所述根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式,包括:通过训练得到的折叠方式预测模型根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式。13.根据权利要求12所述的方法,其特征在于,所述折叠方式预测模型包括前处理层、循环更新层和结构预测层,所述通过训练得到的折叠方式预测模型根据所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵确定所述目标蛋白质的折叠方式,包括:将所述氨基酸序列、所述支撑点对表示矩阵和所述支撑点

残基对表示矩阵输入所述折叠方式预测模型中,通过所述前处理层对所述氨基酸序列进行处理得到多序列对比表示矩阵和残基对表示矩阵;通过所述循环更新层对所述多序列对比表示矩阵、所述残基对表示矩阵、所述支撑点
对表示矩阵和所述支撑点

残基对表示矩阵进行至少一次循环更新;通过所述结构预测层对循环更新后的所述多...

【专利技术属性】
技术研发人员:郭良越刘海宾李盼刘丙华贺俊宏郭春龙
申请(专利权)人:水木未来北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1