基于符号网络的蛋白质交互作用识别与预测方法及其装置制造方法及图纸

技术编号:26794819 阅读:28 留言:0更新日期:2020-12-22 17:11
本发明专利技术公开了基于符号网络的蛋白质交互作用识别与预测方法及其装置,涉及蛋白质分子间的交互作用预测领域,该方法包括:创建蛋白质分子交互作用符号网络图,得到符号网络图的邻接矩阵;获取分子节点对,分别计算节点对的二阶路径相似性得分和三阶路径相似性得分;根据节点对的所述二阶路径相似性得分和三阶路径相似性得分计算分子节点对的边值预测得分;根据所述节点对的边值预测得分识别分子间的交互作用类型,并对蛋白质分子间的未知链接进行预测。本发明专利技术能够解决现有蛋白质分子间的相互作用预测研究不能满足现有技术需求的问题,对两节点间已存在但缺失符号类型的链接进行符号预测,从而识别分子间的交互作用类型,并对未知链接进行边值预测。

【技术实现步骤摘要】
基于符号网络的蛋白质交互作用识别与预测方法及其装置
本专利技术涉及蛋白质分子间的交互作用预测领域,具体涉及基于符号网络的蛋白质交互作用识别与预测方法及其装置。
技术介绍
蛋白质之间的交互作用是细胞实现功能的基础,对蛋白质交互作用预测模型的构建,有利于揭示蛋白质之间相互的促进或抑制作用关系,有利于理解细胞调控及其信号传导的过程,了解细胞中蛋白复合体形成的分子机制,拓展对蛋白质功能的理解,从整体上了解生物功能的运行机理。因此,研究蛋白质之间的交互作用,有助于从系统角度理解各种生物学过程,有助于在分子、细胞和生物体等多个层次上全面揭示生命过程的许多本质问题。信号传导、细胞周期调控、疾病的发生等众多重要生理或病理活动,均是通过蛋白质交互作用及其关系网络来实现的。因此,对蛋白质交互作用关系的研究有助于探索疾病的发生机制,同时还有助于寻找新的药物靶标,为新药研发开辟道路。因此,蛋白质交互作用预测的研究引起相关领域学者们的广泛关注,并提出许多生化实验检测方法和计算预测方法。当前可用的生物数据在不断地迅速增长,仍有很多生物信息如蛋白质交互作用信息还未被发现,而这些潜在的或未知的信息对生物过程的研究是至关重要的,因此,如何定义一个可靠的能度量蛋白质分子间交互作用强度及类型的指标是影响蛋白质未知功能预测或蛋白质复合物识别性能的关键之一。但是,尽管目前的技术成功地鉴定了部分物种中重要蛋白质之间的相互作用,如酵母菌、果蝇和幽门螺杆菌,但生化实验检测方法的计算成本高且耗时长。而且每种实验方法均有其自身的缺点,使得通过生化实验方法检测出来的数据存在一定比例的假阳性和假阴性。此外,实验发现的蛋白质交互作用关系仅占整个蛋白质交互作用网络的一小部分,许多真实存在的交互作用关系还尚未被人类所发现,这些缺点的存在使得生物化学实验很难实现大规模蛋白质交互作用关系的预测。
技术实现思路
本专利技术的目的在于提供一种基于符号网络的蛋白质交互作用识别与预测方法及其装置,用以解决现有蛋白质分子间的相互作用关系预测研究不能满足现有技术需求的问题。为实现上述目的,本专利技术主要提供如下技术方案:第一方面,本专利技术提供了一种基于符号网络的蛋白质交互作用识别与预测方法,所述方法包括:创建蛋白质分子交互作用符号网络图,得到符号网络图的邻接矩阵;获取分子节点对,分别计算分子节点对的二阶路径相似性得分和三阶路径相似性得分;根据节点对的所述二阶路径相似性得分和三阶路径相似性得分计算分子节点对的边值预测得分;根据所述节点对的边值预测得分识别分子间的交互作用类型,并对蛋白质分子间的未知链接进行预测。优选地,所述分别计算分子节点对的二阶路径相似性得分和三阶路径相似性得分,具体包括:对于分子符号网络图G中任意节点对<vi,vj>,查找连接节点vi与vj的步长为2的所有路径,基于结构平衡理论计算节点对的2阶相似性得分BScore2(vi,vj),并存至2阶路径相似性矩阵BS2中,其中BS2(i,j)=BScore2(vi,vj);查找G中连接vi与vj的步长为3的所有路径,基于结构平衡理论计算节点对的3阶相似性得分BScore3(vi,vj),并存至3阶路径相似性矩阵BS3中,其中BS3(i,j)=BScore3(vi,vj)。优选地,所述计算分子节点对的边值预测得分,具体包括:分子节点对的边值预测得分为连接节点对<vi,vj>的步长为2和步长为3的所有路径对于两节点的相似性贡献总和,记作BScore(vi,vj),BScore(vi,vj)=λ*BScore2(vi,vj)+(1-λ)*BScore3(vi,vj),其中,λ为可调步长影响因子。优选地,根据所述分子节点对的边值预测得分识别分子间的交互作用类型,包括对分子间已存在的链接进行符号预测,具体包括:若BScore(vi,vj)>0,则符号预测结果为正,两分子节点间建立正向链接,交互作用类型为促进关系;若BScore(vi,vj)<0,则符号预测结果为负,两分子节点间建立负向链接,交互作用类型为抑制作用;若BScore(vi,vj)=0,则计算两个分子节点的负密度,根据两分子节点的负密度与网络平均负密度的关系来确定分子间交互作用关系的符号预测结果。优选地,所述根据两分子节点的负密度与网络平均负密度的关系来确定分子间交互作用关系的符号预测结果,具体包括:计算和节点vi相连的负向链接数目与和vi相连的总链接数目的比值,得到节点vi的节点负密度,记为D-(vi);计算和节点vj相连的负向链接数目与和vj相连的总链接数目的比值,得到节点vj的节点负密度,记为D-(vj);计算蛋白质分子交互作用网络中所有节点负密度的平均值,记为D-(G);当且仅当D-(vi)>D-(G),且D-(vj)>D-(G)时,符号预测结果为负,交互作用类型为抑制作用;否则为正,交互作用类型为促进关系。优选地,根据所述分子节点对的边值预测得分对蛋白质分子间的未知链接进行预测,具体包括:将节点对的边值预测得分BScore(vi,vj)的绝对值进行降序排序,将前k个节点对对应的链接作为图G中蛋白质分子间基于相似性与结构平衡理论的未知链接边值预测结果,链接的符号类型与节点对的边值预测得分BScore(vi,vj)的符号类型相同。第二方面,本专利技术提供一种基于符号网络的蛋白质交互作用识别与预测装置,所述装置包括:节点获取单元,用于获取蛋白质分子间交互作用符号网络图中的分子节点对;相似性得分计算单元,用于计算分子节点对的二阶路径相似性得分和三阶路径相似性得分;边值预测得分计算单元,用于根据节点对的二阶路径相似性得分和三阶路径相似性得分计算分子节点对的边值预测得分;链接预测单元,用于根据节点对的边值预测得分进行分子间交互作用关系的识别及预测,具体包括对两节点间已存在的链接进行分子间的交互作用类型进行识别,和对蛋白质分子间的未知链接进行预测。第三方面,本专利技术提供一种基于符号网络的蛋白质交互作用识别与预测系统,所述系统包括:至少一个处理器和至少一个存储器;所述存储器用于存储一个或多个程序指令;所述处理器用于运行一个或多个程序指令,用以执行基于符号网络的蛋白质交互作用识别与预测方法。第四方面,本专利技术还提供一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被一种系统执行基于符号网络的蛋白质交互作用识别与预测方法。本专利技术提供的技术方案至少具有如下优点:本专利技术提供的基于符号网络的蛋白质交互作用识别与预测方法及其装置,利用蛋白质分子之间的交互作用关系构建蛋白质分子交互作用符号网络图,根据相似性与结构平衡理论结合的符号网络边值预测方法,计算出目前不相连的任意两节点间的边值预测得分,得分的绝对值度量了两节点的相似程度,即未知链接存在或建立的概率,得分的正负即为链接的符号预测结果,将最有可能建立的前k个链接输出,便可以得知蛋白质作用网络中缺失的那些交互作用关系的强度以及促进或抑制的作用类型,不仅能够对两本文档来自技高网
...

【技术保护点】
1.基于符号网络的蛋白质交互作用识别与预测方法,其特征在于,所述方法包括:/n创建蛋白质分子交互作用符号网络图,得到符号网络图的邻接矩阵;/n获取分子节点对,分别计算分子节点对的二阶路径相似性得分和三阶路径相似性得分;/n根据节点对的所述二阶路径相似性得分和三阶路径相似性得分计算分子节点对的边值预测得分;/n根据所述节点对的边值预测得分识别分子间的交互作用类型,并对蛋白质分子间的未知链接进行预测。/n

【技术特征摘要】
1.基于符号网络的蛋白质交互作用识别与预测方法,其特征在于,所述方法包括:
创建蛋白质分子交互作用符号网络图,得到符号网络图的邻接矩阵;
获取分子节点对,分别计算分子节点对的二阶路径相似性得分和三阶路径相似性得分;
根据节点对的所述二阶路径相似性得分和三阶路径相似性得分计算分子节点对的边值预测得分;
根据所述节点对的边值预测得分识别分子间的交互作用类型,并对蛋白质分子间的未知链接进行预测。


2.如权利要求1所述的基于符号网络的蛋白质交互作用识别与预测方法,其特征在于,所述分别计算分子节点对的二阶路径相似性得分和三阶路径相似性得分,具体包括:
对于分子符号网络图G中任意节点对<vi,vj>,查找连接节点vi与vj的步长为2的所有路径,基于结构平衡理论计算节点对的2阶相似性得分BScore2(vi,vj),并存至2阶路径相似性矩阵BS2中,其中BS2(i,j)=BScore2(vi,vj);
查找G中连接vi与vj的步长为3的所有路径,基于结构平衡理论计算节点对的3阶相似性得分BScore3(vi,vj),并存至3阶路径相似性矩阵BS3中,其中BS3(i,j)=BScore3(vi,vj)。


3.如权利要求1所述的基于符号网络的蛋白质交互作用识别与预测方法,其特征在于,所述计算分子节点对的边值预测得分,具体包括:
分子节点对的边值预测得分为连接节点对<vi,vj>的步长为2和步长为3的所有路径对于两节点的相似性贡献总和,记作BScore(vi,vj),
BScore(vi,vj)=λ*BScore2(vi,vj)+(1-λ)*BScore3(vi,vj)
其中,λ为可调步长影响因子。


4.如权利要求1所述的基于符号网络的蛋白质交互作用识别与预测方法,其特征在于,根据所述分子节点对的边值预测得分识别分子间的交互作用类型,包括对分子间已存在的链接进行符号预测,具体包括:
若BScore(vi,vj)>0,则符号预测结果为正,两分子节点间建立正向链接,交互作用类型为促进关系;
若BScore(vi,vj)<0,则符号预测结果为负,两分子节点间建立负向链接,交互作用类型为抑制作用;
若BScore(vi,vj)=0,则计算两个分子节点的负密度,根据两分子节点的负密度与网络平均负密度的关系来确定分子间交互作用关系的符号...

【专利技术属性】
技术研发人员:刘苗苗张永生王勇张国华刘志刚王茱
申请(专利权)人:东北石油大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1