【技术实现步骤摘要】
结合网络聚类方法的全局多网络比对方法
本专利技术涉及全局多网络比对领域,具体涉及一种结合网络聚类方法的全局多网络比对方法。
技术介绍
21世纪以来,不同研究领域,如社交网络、商业交易和分子生物学等,可获得的数据量都出现了爆炸式增长。将蛋白质及其相互作用以网络(图)的形式表示并研究新的策略对其进行分析,是目前的一个研究热点。在蛋白质相互作用网络中,节点表示蛋白质,边表示两个蛋白质之间的相互作用。基于蛋白质相互作用网络的比对研究较为广泛,主要分为成对(两个网络)网络比对和多(三个及以上)网络比对。早期的网络比对算法多为成对比对,旨在寻找两个网络中相似度最高的映射节点。自2008年起网络比对的研究逐渐转移到多网络比对算法上,多网络比对算法可以同时得到多个网络间节点的映射关系,因此多网络比对能够获得更加深入的生物意义。由于网络比对问题可看为子图同构问题,因此网络比对是NP-完全问题,一直以来网络比对通过采用启发式方法来解决这个问题。早期多使用贪心算法进行比对,经过多年发展越来越多的方法用于网络比对当中,例如,匈牙利算 ...
【技术保护点】
1.一种结合网络聚类方法的全局多网络比对方法,其特征在于,包括:/n步骤1.读取蛋白质相互作用网络数据和不同物种间的序列相似性数据,以及设定参数α和β,构建蛋白质相互作用网络G和序列相似性网络S;/n步骤2.对序列相似性数据进行预处理,利用参数β将序列相似性得分较小的边删除,得到过滤后的网络S
【技术特征摘要】
1.一种结合网络聚类方法的全局多网络比对方法,其特征在于,包括:
步骤1.读取蛋白质相互作用网络数据和不同物种间的序列相似性数据,以及设定参数α和β,构建蛋白质相互作用网络G和序列相似性网络S;
步骤2.对序列相似性数据进行预处理,利用参数β将序列相似性得分较小的边删除,得到过滤后的网络Sβ;
步骤3.计算所有网络中每一个节点的权重,根据节点的度和邻居节点,将度小的节点和边的权重转移到度较大的节点和边上;
步骤4在相应搜索的图中,采用网络聚类算法生成候选簇;
步骤5计算当前候选比对簇的目标函数得分,选择得分最高的候选比对簇作为比对结果;
步骤6输出比对结果,并对比对结果进行分析。
2.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤1具体如下:
首先,读取用户设定的用来决定拓扑和序列相似性所占比重的参数α和用来过滤序列相似性信息的参数β;其次确定输入网络个数k,并对蛋白质相互作用网络进行批次读取,并构建蛋白质相互作用网络G={G1,G2,…,Gk};并读取不同网络间的序列相似性信息;构建序列信息网络S。
3.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤2具体如下:
根据读取的阈值系数β,对序列相似性信息进行过滤;首先由于序列相似性的信息量巨大,随着网络数增多数据量呈指数级增长,随之计算难度也会增大;其次由于目前许多真实物种的序列相似性信息不完整,某些序列信息可能会影响比对结果的准确性;因此在使用序列相似性辅助比对过程时,需要对序列信息进行过滤;对于序列信息网络S中任一条边(u,v),若其边的得分小于相应边相关的阈值,则删除网络S中的这条边,最终得到经过过滤的网络Sβ:
w(u,v)<β×max(u,v)(1)
4.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤3具体如下:
(a)为网络中的节点和节点间的边设置初始值;
(b)将节点度为1的节点的权重转移到它的邻居节点和边上;
(c)将节点度大于1且小于10的节点权重转移到它的邻居节点和边上;
(d)根据节点的权重和与之相连的边的权重计算节点在网络中的重要性得分,λ表示计算节点权重时,相关边的权重得分对于节点权重的影响大小;
计算每个节点相关的序列同源得分;
(e)计算网络中每一个节点的最终权重得分;
Weight(u)=α×importance(u)+(1-α)×B(v)(8)
(f)结合聚类方法搜索比对:
根据序列相似性信息可以构建一个加权k分完全图S,其中节点表示的是相应网络中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。