当前位置: 首页 > 专利查询>南昌大学专利>正文

磷酸化位点特异激酶的预测方法技术

技术编号:30230680 阅读:22 留言:0更新日期:2021-09-29 10:03
本发明专利技术涉及一种磷酸化位点特异激酶的预测方法,具体步骤如下:根据数据库中的数据构建激酶

【技术实现步骤摘要】
磷酸化位点特异激酶的预测方法


[0001]本专利技术涉及生物信息领域,具体的说,涉及一种磷酸化位点特异激酶的预测方法。

技术介绍

[0002]蛋白激酶催化的磷酸化是真核生物体内最普遍存在的翻译后修饰,几乎对所有细胞行为都起着重要的调控作用,包括DNA修复、转录调控、细胞调亡、免疫应答、新陈代谢和细胞分化。越来越多的实验研究揭示蛋白激酶能直接或间接地影响蛋白质的异常磷酸化,并牵涉很多严重疾病的发生发展。因此研究激酶对蛋白磷酸化位点的特异性作用对于理解激酶在生理和病理过程中的调控机制以及相关疾病的药物设计具有重要意义。
[0003]随着生物技术的发展,大量的磷酸化位点被实验证实并收入到磷酸化数据库中。实验方法昂贵耗时,并且目前为止高通量检测磷酸化位点激酶的实验方法鲜有报道,发现激酶信息是偶然的,因此数据库中的磷酸化位点只有小部分拥有激酶的注释,大量的位点是没有激酶标注信息的。
[0004]鉴于现存实验方法的局限性,开发预测方法更高效更全面地识别磷酸化显得十分必要。虽然已经有一些计算工具被提出,但当前可用的预测工具存在以下不足:一些工具仅能预测激酶和底物蛋白的关系,不能对磷酸化位点的催化激酶进行准确地预测;绝大部分工具基于机器学习算法,需要对样本进行特征编码,这个过程不可避免地会造成原始信息的丢失,此外,不平衡的正负样本集也会影响到机器学习的预测结果;最后,一些方法在提取PPI网络信息时只考虑局部信息而未使用全局信息,这可能导致假阳性的出现。

技术实现思路

[0005]针对上述现有技术中的不足,本专利技术提供一种通过有效结合蛋白质

蛋白质相互作用网络信息和局部序列信息,针对用户给出的磷酸化位点进行催化激酶的预测,改进现有磷酸化的整体预测质量的磷酸化位点特异激酶的预测方法。
[0006]本专利技术所采取的技术方案是:
[0007]一种磷酸化位点特异激酶的预测方法,
[0008]步骤S101,根据数据库中的数据构建激酶

底物异构网络,并计算赋予其边不同的权重;
[0009]步骤S102,利用步骤S101建立的网络,采用MWBM算法来预测潜在的激酶

底物关系,给出查询底物和不同激酶间相互作用的可能性打分;
[0010]步骤S103,对于查询的位点,截取其氨基酸片段并计算该片段和不同激酶催化的底物片段之间的序列相似性打分P
seq

[0011]步骤S104,结合预测出的潜在的激酶

底物关系和序列相似性打分P
seq
,对查询位点的催化激酶进行预测并给出预测结果。
[0012]优选的,根据数据库中的数据构建激酶

底物异构网络步骤如下:
[0013]步骤S201,计算激酶

激酶和底物

底物相似性,为了减少由于边缘损失造成的假
阴性,使用边缘聚类算法(NECC)更新蛋白质

蛋白质相互作用(PPI)网络边的权重,并与STRING数据库中已标注的PPI置信分数(CF)通过取平均数的方式结合,确定激酶

激酶相互作用网络、底物

底物相互作用网络中边的权重;
[0014]无向图G(V,E)代表PPI网络,定义v∈V为节点蛋白质,(u,v)∈E为两个节点蛋白u和v之间的相互作用关系;
[0015]ECC用来表示两个节点之间的紧密程度:
[0016][0017]其中Z
u,v
是蛋白u和v的共同邻居集,d(x)代表了节点x的度,边缘聚类系数NECC如下式定义:
[0018][0019]其中:
[0020][0021]图G(V,E)中边的权重可以根据下式更新:
[0022][0023]其中CF(u,v)是蛋白对(u,v)在数据库STRING中已有的置信分数;
[0024]对于任意两个蛋白质u和v,都能在图上找到他们之间的最短路径,SP(u,v)代表了最短路径中的边的集合,最终,蛋白u和v之间的相似性可以更新为:
[0025][0026]W(i,j)是由式(4)计算得出的蛋白i和j之间边的权重;由于激酶和底物都是蛋白质,使用上述方法计算激酶

激酶相似性和底物

底物相似性,以激酶

激酶相似性为例,从数据库STRING中得到激酶蛋白间的相互作用网络,由式(1)至式(4)更新数据库中已有的边的权重,随后从激酶集中任选两个激酶,两者之间存在一条最短路径,利用式(5)能够计算其相似性,底物

底物相似性以相同方法计算;
[0027]步骤S202,建立激酶

底物异构网络,根据步骤S201计算的相似性,设计两个新的网络G
k
(U,E
k
)和G
S
(V,E
s
),在这里U代表了激酶集而E
k
包含了激酶对之间所有的边,V表示底物集,E
s
包含了两两底物间所有的边;两个网络中,边的权重为步骤S201计算得到的相似性,如果两个节点间的相似性为0,则认为这两个节点间没有相互作用;
[0028]使用G
I
表示激酶

底物相互作用的网络,如果激酶k
i
和底物s
j
之间已经有实验证实的相互作用存在,那么k
i
和s
j
之间存在边e
ij
,e
ij
的权重为k
i
和s
j
之间已证实的相互作用发生的次数;
[0029]将G
k
、G
S
和G
I
结合起来,建立激酶

底物异构网络模型。
[0030]优选的,基于相似性网络使用MWBM算法进行预测步骤如下;
[0031]根据步骤S101建立的激酶

激酶网络G
k
,底物

底物网络G
S
和激酶

底物网络G
I
分别建立其邻接矩阵K、S和I;
[0032]以S为例介绍如何构建邻接矩阵,s
i
和s
j
为底物集V中的两个不同底物,如果(s
i
,s
j
)∈E
s
,那么S(i,j)=W
ij
,否则S(i,j)=0,激酶相似度邻接矩阵和激酶

底物相互作用邻接矩阵以相同的方法构建;在使用矩阵进行预测前,对三个邻接矩阵进行归一化,选择Laplace归一化准则对K、S实施归一化,得到归一矩阵K
n
和S
n

[0033][00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种磷酸化位点特异激酶的预测方法,其特征在于,具体步骤如下:步骤S101,根据数据库中的数据构建激酶

底物异构网络,并计算赋予其边不同的权重;步骤S102,利用步骤S101建立的网络,采用加权最大二部图匹配(MWBM)算法来预测潜在的激酶

底物关系,给出查询底物和不同激酶间相互作用的可能性打分;步骤S103,对于查询的位点,截取其氨基酸片段并计算该片段和不同激酶催化的底物片段之间的序列相似性打分P
seq
;步骤S104,结合预测出的潜在的激酶

底物关系和序列相似性打分P
seq
,对查询位点的催化激酶进行预测并给出预测结果。2.根据权利要求1所述磷酸化位点特异激酶的预测方法,其特征在于:根据数据库中的数据构建激酶

底物异构网络步骤如下:步骤S201,计算激酶

激酶和底物

底物相似性,使用边缘聚类算法更新蛋白质

蛋白质相互作用(PPI)网络边的权重,并与STRING数据库中已标注的PPI置信分数(CF)通过取平均数的方式结合,确定激酶

激酶相互作用网络、底物

底物相互作用网络中边的权重;无向图G(V,E)代表PPI网络,定义v∈V为节点蛋白质,(u,v)∈E为两个节点蛋白u和v之间的相互作用关系;ECC用来表示两个节点之间的紧密程度:其中Z
u,v
是蛋白u和v的共同邻居集,d(x)代表了节点X的度,边缘聚类系数NECC如下式定义:其中:图G(V,E)中边的权重可以根据下式更新:其中CF(u,v)是蛋白对(u,v)在数据库STRING中已有的置信分数;对于任意两个蛋白质u和v,都能在图上找到他们之间的最短路径,SP(u,v)代表了最短路径中的边的集合,最终,蛋白u和v之间的相似性可以更新为:W(i,j)是由式(4)计算得出的蛋白i和j之间边的权重;由于激酶和底物都是蛋白质,使用上述方法计算激酶

激酶相似性和底物

底物相似性,以激酶

激酶相似性为例,从数据库STRING中得到激酶蛋白间的相互作用网络,由式(1)至式(4)更新数据库中已有的边的权重,随后从激酶集中任选两个激酶,两者之间存在一条最短路径,利用式(5)能够计算其相似性,底物

底物相似性以相同方法计算;步骤S202,建立激酶

底物异构网络,根据步骤S201计算的相似性,设计两个新的网络G
k
(U,E
k
)和G
S
(V,E
s
),在这里U代表了激酶集而E
k
包含了激酶对之间所有的边,V表示底物集,E
s
包含了两两底物间所有的边;两个网络中,边的权重为步骤S201计算得到的相似性,如果两个节点间的相似性为0,则认为这两个节点间没有相互作用;使用G
I
表示激酶

底物相互作用的网络,如果激酶k
i
和底物s
j
之间已经有实验证实的相互作用存在,那么k
i
和s
j
之间存在边e
ij
,e
ij
的权重为k
i
和s
j
之间已证实的相互作用发生的次数;将G
k
、G
S
和G
I
结合起来,建立激酶

底物异构网络模型。3.根据权利要求1所述磷酸化位点特异激酶的预测方法,其特征在于:基于相似性网络使用MWBM算法进行预测步骤如下;根据步骤S101建立的激酶

激酶网络G
k
,底物

底物网络G
S
和激酶

底物网络G
I
分别建立其邻接矩阵K、S和I;以S为例介绍如何构建邻接矩阵,s
i
和s
j
为底物集V中的两个不同底物,如果(s
i
,s
j
)∈E
s
,那么S(i,j)=W
ij
,否则S(i,j)=0,激酶相似度邻接矩阵和激酶

底物相互作用邻接矩阵以相同的方法构建;在使用矩阵进行预测前,对三个邻接矩阵进行归一化,选择Laplace归一化准则对K、S实施归一化,得到归一矩阵K
n
和S
n
::其中,D
s
对角矩阵,其对角线上的值D
s
(i,i)等于矩阵S第i行元素值的和,D
k
以同样的方式得到;与K和S不同,采用对称正则化对激酶

底物相互作用矩阵I进行归一化,得到归一矩阵I
n
:...

【专利技术属性】
技术研发人员:施绍萍郭昕昀张菊
申请(专利权)人:南昌大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1