基于分治整合策略的成对蛋白质相互作用网络比对方法技术

技术编号：28126258 阅读：14 留言：0更新日期：2021-04-19 11:41

本发明专利技术公开了一种基于分治整合策略的成对蛋白质相互作用网络比对方法，包括：步骤1：读取源网络和目标网络及BLAST相似性文件；步骤2：采用基于结点和路径相结合的方法分别计算两个网络中结点的相似性得分，结合所述相似性得分分别对两个网络进行模块划分；步骤3：获取同源蛋白对，根据同源蛋白对和BLAST相似性分别计算来自不同网络模块间的相似性；根据相似性将来自不同网络的模块进行一对一匹配。本发明专利技术的有益效果：使用基于结点和基于路径的相似性计算方法，代替自相似性文件，解决了对自相似性文件的依赖问题。相似性文件的依赖问题。相似性文件的依赖问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于分治整合策略的成对蛋白质相互作用网络比对方法

[0001]本专利技术涉及蛋白质相互作用网络比对领域，具体涉及一种基于分治整合策略的成对蛋白质相互作用网络比对方法。

技术介绍

[0002]随着生物信息学的发展,人们研究集中在蛋白质和DNA等生物大分子.蛋白质分子在生物体内执行着各项重要任务,而蛋白质相互作用是维持细胞结构和功能的基础,因此对蛋白质相互作用网络的研究具有重要意义.其中一类很重要的研究工作就是对蛋白质相互作用网络进行比对分析，通过网络比对可进行蛋白质功能预测以及保守功能模块的挖掘等。
[0003]传统技术存在以下技术问题：
[0004]“SPINAL:scalable protein interaction network aligment”(期刊出处：Bioinformatics.2013,4(29):917
–
924)算法使用一种由粗粒度和细粒度步骤组成的双通道比对算法。粗粒度阶段通过考虑在前一次迭代中计算出的与相邻节点匹配的置信度，迭代地改进每对节点估计匹配置信度的矩阵P。P收敛后开始细粒度阶段，该阶段使用种子
‑
扩展算法来构造比对。此外，在种子
‑
扩展过程的每次迭代中，都执行局部搜索，以直接增加保守边的数量。这种算法存在的问题：过多的考虑拓扑信息，导致最终比对的生物功能质量不高。
[0005]“ModuleAlign:module
‑
based global alignment ofproteinr/>‑
protein interaction networks”(期刊出处：Bioinformatics,2016,32(17):658
‑
664)算法提出了一种同源得分函数，它依靠模块相似性来计算结点的同源得分，并采用了动态匈牙利算法进行求解。这种算法存在的问题：模块化方法选取不当此算法通过模块相似性计算方法比较繁琐且计算方式不当，导致产生错误的生物相似性得分，从而使其生物功能质量较差。
[0006]“AligNet:alignment ofprotein
‑
protein interaction networks”(期刊出处：BMC Bioinformatics,2020,21(Suppl 6):1
‑
22)算法采用了模块化思想，首先对将网络划分为若干个模块，将模块进行枚举比对，最后将所有比对结果合并处理为最终比对。这种算法存在的问题：需要将所有模块进行枚举比对，大大增加了时间复杂度。
[0007]“HubAlign:an accurate and efficient method for global alignment of protein
‑
protein interaction networks”(期刊出处：Bioinformatics,2014,30(17):438
‑
444)算法认为在PPI网络中充当枢纽的蛋白质在功能和拓扑上更为重要，提出了Importance中心性，并使用贪心的种子
‑
扩展算法，根据蛋白质的Importance分数和序列相似度组合对蛋白质进行排序。这种算法存在的问题：算法随机选择结点作为边拆分的起点，不同的起点可能会得到不同质量的比对结果。
[0008]“MAGNA++:Maximizing accuracy in global network alignment via both node and edge conservation”(期刊出处：Bioinformatics,2015,31(14):2409
‑
2411)算法采用了遗传算法的思想进行网络比对，通过不停迭代交叉变异产生新解。有效解决了算
法陷入局部最优解问题。这种算法存在的问题：需要进行上千次的迭代，花费时间较长。
[0009]“INDEX:Incremental depth extension approach forprotein
‑
protein interaction networks alignment”期刊出处：BioSystems,2017,162(2017):24
‑
34)算法提出了一种新的比对策略，考虑了比对分数和对齐核的增长，使得得到的公共连通子图比以往的方法具有更大的边数。这种算法存在的问题：比对的生物质量较差，未能达到较好的生物与拓扑质量的平衡。

技术实现思路

[0010]本专利技术要解决的技术问题是提供一种基于分治整合策略的成对蛋白质相互作用网络比对方法，解决了对同一网络中结点间相似性文件的依赖问题；使用已有蛋白对的匹配关系来预测模块的匹配关系，从而计算模块相似性，解决了模块相似性计算问题；使用度中心性和特征向量中心性捕捉结点的拓扑特性，提高了算法的生物质量和拓扑质量。
[0011]为了解决上述技术问题，本专利技术提供了一种基于分治整合策略的成对蛋白质相互作用网络比对方法，包括：
[0012]步骤1：读取源网络和目标网络及BLAST相似性文件；
[0013]步骤2：采用基于结点和路径相结合的方法分别计算两个网络中结点的相似性得分，结合所述相似性得分分别对两个网络进行模块划分；
[0014]步骤3：获取同源蛋白对，根据同源蛋白对和BLAST相似性分别计算来自不同网络模块间的相似性；根据相似性将来自不同网络的模块进行一对一匹配；
[0015]步骤4：根据特征向量中心性和BLAST相似性计算每对已匹配模块中结点间的相似性，并进行模块内比对，将得到的子比对结果合并为候选结果集；
[0016]步骤5：对候选结果集使用超图匹配算法得到最终一对一比对结果。
[0017]在其中一个实施例中，步骤2中，计算相似性得分具体如下：
[0018]采用度和最短路径长度衡量两个结点间的相似性，结点相似性计算如公式(1)
[0019][0020]其中G为网络，u,v为G中的结点，deg
u
指结点u的度，deg
G
指图G中的最大度，D(G)指图G的直径，d
G
(u,v)指结点u,v的最短路径长度。
[0021]在其中一个实施例中，步骤2中，模块划分步骤如下：
[0022](1)对源网络G使用公式(1)进行相似性计算，得到相似性矩阵S；
[0023](2)对于矩阵S中的每一行，根据数值大小，将相似性在前75％的结点构成一个模块，模块中心为该行矩阵的行名。
[0024]在其中一个实施例中，步骤3具体如下：
[0025]生成同源蛋白对，并根据蛋白对在模块中的集体行为计算模块的同源相似性，使用公式(2)将同源蛋白对文件转换为同源矩阵π，其中i，j分别为来自两个网络的蛋白质；
[0026][0027]则根据矩阵π得到的模块m1，m2的同源相似性得分为：
[00本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于分治整合策略的成对蛋白质相互作用网络比对方法，其特征在于，包括：步骤1：读取源网络和目标网络及BLAST相似性文件；步骤2：采用基于结点和路径相结合的方法分别计算两个网络中结点的相似性得分，结合所述相似性得分分别对两个网络进行模块划分；步骤3：获取同源蛋白对，根据同源蛋白对和BLAST相似性分别计算来自不同网络模块间的相似性；根据相似性将来自不同网络的模块进行一对一匹配；步骤4：根据特征向量中心性和BLAST相似性计算每对已匹配模块中结点间的相似性，并进行模块内比对，将得到的子比对结果合并为候选结果集；步骤5：对候选结果集使用超图匹配算法得到最终一对一比对结果。2.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法，其特征在于，步骤2中，计算相似性得分具体如下：采用度和最短路径长度衡量两个结点间的相似性，结点相似性计算如公式(1)其中G为网络，u,v为G中的结点，deg
u
指结点u的度，deg
G
指图G中的最大度，D(G)指图G的直径，d
G
(u,v)指结点u,v的最短路径长度。3.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法，其特征在于，步骤2中，模块划分步骤如下：(1)对源网络G使用公式(1)进行相似性计算，得到相似性矩阵S；(2)对于矩阵S中的每一行，根据数值大小，将相似性在前75％的结点构成一个模块，模块中心为该行矩阵的行名。4.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法，其特征在于，步骤3具体如下：生成同源蛋白对，并根据蛋白对在模块中的集体行为计算模块的同源相似性，使用公式(2)将同源蛋白对文件转换为同源矩阵π，其中i，j分别为来自两个网络的蛋白质；则根据矩阵π得到的模块m1，m2的同源相似性得分为：公式(3)受限于公式(4)：模块相似性计算公式为：S(m1,m2)＝HS(m1,m2)+BLAST(c1,c2)
ꢀꢀꢀꢀꢀꢀ
(5)
其中c1，c2分别为模块m1，m2的簇中心；BLAST为序列相似性；根据公式...

【专利技术属性】
技术研发人员：陈璟，刘晓，
申请(专利权)人：江南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人