当前位置: 首页 > 专利查询>江南大学专利>正文

融合多种拓扑信息的生物网络比对方法技术

技术编号:25443501 阅读:90 留言:0更新日期:2020-08-28 22:30
本发明专利技术公开了一种融合多种拓扑信息的生物网络比对方法。本发明专利技术一种融合多种拓扑信息的生物网络比对方法,包括:步骤1读取网络及其序列相似性得分,分别计算两个网络的相关值矩阵,并对网络进行模块划分,同一模块内的结点具有较高的相似性;步骤2计算模块内结点的相似性得分,并对模块进行两两结点比对;步骤3计算模块间的相似性得分,并对模块进行比对;步骤4将步骤2,3中得到的结点映射关系进行整合,筛选,得到1对1的结点映射关系。本发明专利技术的有益效果:(1)从网络结构、度、结点邻居、特征向量中心性、局部边保守等方面充分挖掘了结点的拓扑相似性,提高了比对的拓扑质量。

【技术实现步骤摘要】
融合多种拓扑信息的生物网络比对方法
本专利技术涉及生物网络领域,具体涉及一种融合多种拓扑信息的生物网络比对方法。
技术介绍
近年来,随着生物实验的发展,产生了大量的生物网络数据,使用网络比对对生物网络进行分析,比较不同物种间的相互作用,可以更好地理解物种间的进化关系,发现保守的功能成分和实现功能预测。本专利技术研究两个网络的比对,两个网络分别为源网络和目标网络。源网络结点数目比目标网络少,且其结点功能均为已知的;目标网络中蛋白质的功能均未知。其生物意义为通过成对网络比对实现源网络与目标网络之间的功能转移,从而更好的挖掘目标网络中蛋白质的功能。网络比对算法由得分函数和搜索算法两部分组成,得分函数用于评价结点之间的相似性;搜索算法则根据得分函数搜索全局相似性最大的比对结果。目前已有的搜索算法主要分为二步算法和基于目标函数的搜索算法,二步算法的第一步是计算两个不同输入网络的结点相似性,从而得到一个结点相似性得分矩阵。根据这个相似性得分矩阵将网络比对问题转化为最大权重的二部图匹配问题,其中第一步计算的结点相似性得分就是二部图的权重。二步算法的第本文档来自技高网...

【技术保护点】
1.一种融合多种拓扑信息的生物网络比对方法,其特征在于,包括:/n步骤1读取网络及其序列相似性得分,分别计算两个网络的相关值矩阵,并对网络进行模块划分,同一模块内的结点具有较高的相似性;/n步骤2计算模块内结点的相似性得分,并对模块进行两两结点比对;/n步骤3计算模块间的相似性得分,并对模块进行比对;/n步骤4将步骤2,3中得到的结点映射关系进行整合,筛选,得到1对1的结点映射关系;/n步骤5删除已比对结点,并重复步骤2-5,小网络中的结点全部被比对上,或模块间相似性得分为0,算法停止。/n

【技术特征摘要】
1.一种融合多种拓扑信息的生物网络比对方法,其特征在于,包括:
步骤1读取网络及其序列相似性得分,分别计算两个网络的相关值矩阵,并对网络进行模块划分,同一模块内的结点具有较高的相似性;
步骤2计算模块内结点的相似性得分,并对模块进行两两结点比对;
步骤3计算模块间的相似性得分,并对模块进行比对;
步骤4将步骤2,3中得到的结点映射关系进行整合,筛选,得到1对1的结点映射关系;
步骤5删除已比对结点,并重复步骤2-5,小网络中的结点全部被比对上,或模块间相似性得分为0,算法停止。


2.如权利要求1所述的融合多种拓扑信息的生物网络比对方法,其特征在于,模块划分具体如下:
模块划分是针对单个网络进行的;
首先,计算网络的相关值矩阵,该矩阵给出了结点间的相似性关系,本发明给出了结点间关系的四种定义,分别为强相关,弱相关,相关与不相关;
如果两个结点间有一条边相连,则称该对结点为强相关;
若结点间不存在直接相连的边,但可以通过其他结点间接相连,则称为弱相关;
符合强相关和弱相关的结点也称为相关;
不存在相关关系的结点对均称为不相关;
相关值计算公式如下:



其中,Θ强相关结点集,Φ为弱相关结点集,为不相关结点集;max{1,|Φ*|M}指所有相关结点中所经过的中间边数目的最大值,指从结点u到v所经过的中间边数目;公式(1)为归一化后的相关值,其值越大,表示结点间的相似性越高;
然后,根据相关值矩阵,分别对G1,G2进行模块化分,得到模块集合CG1,CG2;详细步骤如下:
a)构建关于网络G=(V,E)中所有结点对的相关值矩阵Ψ;
b)对于初始化|V|个分别以为模块中心的模块,记为
c)模块的构建方法为:根据Ψ,得到其他结点与的相关值,并将其按降序排列,选取相关值在前25%的结点加入到模块其他模块构造方法类似,最终得到


3.如权利要求1所述的融合多种拓扑信息的生物网络比对方法,其特征在于,模块内结点比对具体如下:
将网络G1,G2分别模块化后得到两个模块集合C1,C2;将C1中的每个模块与C2中的每个模块分别使用种子扩展方法进行比对,得到|C1|*|C2|对模块比对结果,|C1|,|C2|分别指模块的数目;
其中模块比对过程中用到的结点相似性得分函数为:




为结点(s,t)间的总相似性得分,B(s,t)为结点(s,t)的序列相似性得分,该得分由BLAST++工具计算得出,用以评价结点间的生物相似性,值越大,结点相似性越高;为结点间的拓扑相似性得分,它由一种基于特征向量中心性的拓扑向量元组计算而来,其中
1)表示结点的度,即的邻居数;
2)表示结点的特征向量中心性,用以衡量结点在网络中的中心性地位;
3)表示结点邻居的平均特征向量中心性;
因此,结点对(s,t)的拓扑相似得分具体计算方式公式如公式(3);其值越小,结...

【专利技术属性】
技术研发人员:陈璟刘晓
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1