一种基于多网络拓扑结构的蛋白质功能预测方法技术

技术编号:25640113 阅读:59 留言:0更新日期:2020-09-15 21:31
一种基于多网络拓扑结构的蛋白质功能预测方法,其属于生物信息应用的技术领域。该方法利用网络特有的拓扑结构,采用加权的方法使得网络结构更加明显,方便后续采集蛋白质网络特征节点。同时利用网络的拓扑结构信息整合多个网络,对每个蛋白质网络采用重启随机游走,获得每一个节点的一个分布,利用提取到的拓扑信息和数据的其他信息来推断节点的属性,从而捕获其与网络中其他所有节点的相关性。该方法轻松扩展到大量网络,分析每个网络中的扩散以表征每个节点的拓扑上下文。该方法解决了蛋白质功能预测中功能标签空间巨大的问题,提高了获取的压缩标签可解释性,通过本方法使得蛋白质预测功能更加完善和精确。

【技术实现步骤摘要】
一种基于多网络拓扑结构的蛋白质功能预测方法
本专利技术涉及生物信息学应用领域,具体说是一种利用网络的拓扑结构信息来整合多个网络,推断节点的属性,从而实现蛋白质功能预测的方法。
技术介绍
随着生物学和计算机技术的发展,生物信息学已经越来越受到重视,也因此发挥了巨大技术经济效益和社会效益。然而在人类社会信息化的高度发展下,生物信息学的传统研究方法已经不能完全适应,逐渐乏力,甚至达到了瓶颈的状态。在众多生物信息学问题中,准确地标注蛋白质功能是功能基因组学的核心任务之一,蛋白质功能标注信息存在大量缺失且功能标签空间巨大的问题。一个可靠的大规模蛋白质一蛋白质相互作用网络是生物学家的一个宝贵资源,因为它可被用来发现未知的信号通路、复合物或进行蛋白质功能预测,目前高通量实验方法可以实现大量的大规模分子和功能相互作用网络,这些网络的连通性为推断基因和蛋白质的功能注释提供了丰富的信息来源。高通量实验方法背后的一个关键是,在相互作用网络中共同定位或具有类似拓扑作用的基因或蛋白质更有可能在功能上相互关联。这一发现使我们能够通过从相似的基因和更好理解的蛋白质中本文档来自技高网...

【技术保护点】
1.一种基于多网络拓扑结构的蛋白质功能预测方法,其特征在于,包括以下步骤:/nS1、获取蛋白质相互作用网络:从STRING数据库下载蛋白质-蛋白质相互作用网络的集合,即PPI数据合集;所述PPI数据集合包括六个异源网络;/nS2、转换蛋白质相互作用网络:采用加权线图算法将原始的蛋白质相互作用网络变换成其对应的加权线图G=(V,E),该分子相互作用网络共有n个节点,每一个节点都代表一个蛋白质;/nS3、对每个蛋白质网络采用重启随机游走,获得每一个节点的分布,捕获该节点在网络中与其他所有节点的相关性,得到n维的网络扩散向量;/n对每个网络采用重启随机游走,从初始节点i出发,通过该网络的邻接矩阵和转...

【技术特征摘要】
1.一种基于多网络拓扑结构的蛋白质功能预测方法,其特征在于,包括以下步骤:
S1、获取蛋白质相互作用网络:从STRING数据库下载蛋白质-蛋白质相互作用网络的集合,即PPI数据合集;所述PPI数据集合包括六个异源网络;
S2、转换蛋白质相互作用网络:采用加权线图算法将原始的蛋白质相互作用网络变换成其对应的加权线图G=(V,E),该分子相互作用网络共有n个节点,每一个节点都代表一个蛋白质;
S3、对每个蛋白质网络采用重启随机游走,获得每一个节点的分布,捕获该节点在网络中与其他所有节点的相关性,得到n维的网络扩散向量;
对每个网络采用重启随机游走,从初始节点i出发,通过该网络的邻接矩阵和转移概率矩阵共同作用,决定下一个节点j的走向;根据公式(1)确定从节点i为初始节点进行的重启随机游走



其中,Pc表示该节点重启的概率;A表示网络的转移概率矩阵,矩阵中的每一项Aij表示节点j到节点i的转移概率
ai是一个n维向量,每一项代表着节点i出发到达节点j的概率;当j=i时,ai(j)=1;当j≠i时,ai(j)=0;
Sti是一个n维分布的列向量,每一项代表着表示从节点i出发,重启随机游走t步后到达该节点的概率;

【专利技术属性】
技术研发人员:邓雪纯
申请(专利权)人:大连民族大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1