当前位置: 首页 > 专利查询>上海大学专利>正文

基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法技术

技术编号:8271621 阅读:298 留言:0更新日期:2013-01-31 03:56
本发明专利技术公开了基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法。其步骤如下:A、根据生物分子的序列特征,构建网络T(Gt)和B(GB)中生物分子的初始相似矩阵。B、根据生物分子在网络中的拓扑的相似特征,计算生物分子的相似矩阵S。C、构建专家知识字典。D、基于专家知识,以邻居优先策略进行搜索,获得结果子网。E、计算结果子网R(Gr)与目标子网T(Gt)的相似得分。F、计算p值。G、结果子网可视化。与同类方法相比,该方法计算准确度更高,具有更高的稳定性,能更好地处理生物分子网络间的“空隙”(Gap),获得更多的保守边和节点,且能较好地反映生物分子网络之间的变化情况。

【技术实现步骤摘要】
本专利技术涉及计算机领域,提出了基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法
技术介绍
生物分子网络是复杂网络。在复杂网络中搜索与目标子网最相似的子网是一个局部网络比较问题,涉及到大量的计算,已被证实是一个NP完全问题(Non-deterministicPolynomial的问题,也即是多项式复杂程度的非确定性问题)。目前,研究人员普遍采用图来表示复杂网络,并以图论的方法来研究它们。对于生物分子网络而言,图中的节点表示生物分子,边表示生物分子之间的调控、相互作用等各种关系。由于生物分子网络特有的生物学意义,仅用图论的方法来研究它们是不够的,其 搜索还面临着更多的问题,主要包括(1)每个生物分子都有其生物学意义,要明确一个网络中的某个生物分子和另外一个网络中的哪个生物分子最相似,不仅要考虑生物分子本身的序列,还要考虑它在网络中的拓扑位置;(2)无论是国际公开的数据库中的数据,还是自己通过生物实验获得的数据都存在假阳性和假阴性现象,目前只能通过这些不完全准确和不完整的数据研究生物分子网络;(3)对于要研究的不同的具体问题,网络中各个分子的地位并不是完全平等的,计算过程中要合理利用专家本文档来自技高网...

【技术保护点】
基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法,其特征在于,对于网络A(GA)、网络B(GB)及A中的目标子网T(Gt),基于专家知识,同时考虑网络中生物分子及其在网络中的拓扑相似属性,以邻居节点优先的策略进行网络搜索,以在网络B(GB)中获得与网络T(Gt)在生物意义上最相似的结果子网R(Gr);具体操作步骤如下:A、计算Gt和GB的初始相似矩阵????????????????????????????????????????????????:根据生物分子的序列特征,构建网络T(Gt)和网络B(GB)中生物分子的初始相似矩阵,其中的每个元素表示节点和节点之间的序列相似系数,其具体步骤如下...

【技术特征摘要】
1.基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法,其特征在于,对于网络A (GA)、网络B (Gb)及A中的目标子网T (Gt),基于专家知识,同时考虑网络中生物分子及其在网络中的拓扑相似属性,以邻居节点优先的策略进行网络搜索,以在网络B (Gb)中获得与网络T (Gt)在生物意义上最相似的结果子网R (GJ ;具体操作步骤如下 A 、 计算 G t和 G B的初 始相 似矩 阵S0 :根据生物分子的序列特征,构建网络T (Gt)和网络B (Gb)中生物分子的初始相似矩阵5D,其中的每个元素S°(α 表示节点a e Gi和节点I £ Gs之间的序列相似系数,其具体步骤如下 AllE—Vaiue < I,其余参数取缺省值,用BLAST计算Gt中所有分子在Gs的序列相似分子; A2、按以下公式计算这些生物分子之间的相似系数2.根据权利要求I所述的基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法,其特征在于,所述步骤B的根据生物分子在各自网络中的拓扑相似特征,计算生物分子的相似矩阵,其计算是依赖于步骤A的初始相似矩阵5 ,即生物分子的序列相似矩阵,具体步骤如下 BI、计算生物分子a E Gt和1) G Gs在网络拓扑结构上的平均相似性,其相似性的各个方面在有向网络中分别由AJatD)、A2(a,b)、43(a,o)和A.(a,b)表示,在无向网络中则由Wi (a,b)和V2 {a, b)表示; B2、在生物分子a E GjPI E Gb的序列相似系数基础上增加它们在网络拓扑结构上的平均相似性,迭代,直至一致收敛或振荡收敛;具体公式如下,其中上标々和々W代表迭代次数,5(G,fc)代表α和fc的相似系数,4( 、42(o,fc) > 43(fl,&〕和A,.(atb)表示有向网络中α和I出/入邻居节点和非邻居节点之间的平均相似性,N1 (a,b)和iV2(a,i)表示无向网络中β和的邻居节点和非邻居节点之间的平均相似性表示和“的序列 相似系数 在有向网络中3.根据权利要求2所述的基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法,其特征在于,上述步骤BI中所述的计算生物分子a和6在网络拓扑结构上的平均相似性,其具体方法为 B11、在有向网络中,表示节点a和6的入邻居(即有边从这些邻居节点指向a或办)之间的平均相似性表示节点a和6的出邻居(即有边从a或6指向这些邻居节点)之间的平均相似性,b)表示节点a和6的非入邻居节点(指那些没有边进入a和b的节点)之间的平均相似性表示a和6的非出邻居节点(指那些没有边从a和办指向它的节点)之间的平均相似性;由degin (a)表示进入节点a的边的条数,即a的入度,degDJt(a.)表示从节点<3引出的边...

【专利技术属性】
技术研发人员:谢江谭军马进张武文铁桥
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1