当前位置: 首页 > 专利查询>延安大学专利>正文

提升计算机辅助诊断系统候选疾病基因识别性能的方法技术方案

技术编号:33083629 阅读:29 留言:0更新日期:2022-04-15 10:42
本发明专利技术涉及一种提升计算机辅助诊断系统候选疾病基因识别性能的方法,属于计算机辅助诊断应用技术领域。针对现有的计算机辅助诊断系统在候选疾病基因识别性能存在准确率不高、可靠性不足等技术问题,本发明专利技术在计算机辅助诊断系统中,首先构建多层和多层异构基因网络。然后,利用一种游走于多层和多层异构网络的拓扑偏置随机游走算法来识别疾病基因。系统通过调整游走中的偏置参数,该算法可以在不同相互作用数据源上探索不同层中蛋白质和基因间功能和物理相互作用,并可以在异构网络上执行,其中,步行者可以遍历具有不同类型的节点和边集的网络,从而有效提高系统针对候选疾病基因的识别性能,能够更准确地识别出候选疾病基因。因。因。

【技术实现步骤摘要】
提升计算机辅助诊断系统候选疾病基因识别性能的方法


[0001]本专利技术涉及一种提升计算机辅助诊断系统候选疾病基因识别性能的方法,属于计算机辅助诊断应用


技术介绍

[0002]近年来,利用计算机辅助诊断系统进行生物大分子间物理和功能相互作用的识别,已成为计算机辅助诊断生物网络疾病基因可靠识别工作中的一项重要任务,其识别结果有助于协助医生进一步确定疾病的发病机制,并为下一步制定治疗方案提供有力参考。
[0003]目前,对生物大分子之间物理和功能相互作用的识别,是研究者所筛选出的多种生物体中蛋白质

蛋白质间的相互作用(protein

protein interactions,PPIs),可揭示数千种蛋白质之间功能或物理相互作用。这些生物相关的相互作用通常可以表示为其节点是蛋白质或基因,其边是物理或功能相互作用的生物网络。
[0004]近年来,越来越多的计算机辅助诊断系统通过运行有关算法来探索生物网络的重启随机游走(random walk with restart,RWR),致力于获得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.提升计算机辅助诊断系统候选疾病基因识别性能的方法,其特征在于,包括以下步骤:步骤1:建立包括基因多网络、表型网络和基因

表型网络的多层异构生物网络;步骤2:利用游走于多层和多层异构网络的拓扑偏置随机游走算法BRWR,识别疾病基因;首先,采用一种拓扑偏置随机游走方法,允许随机游走偏置目标节点的各种拓扑属性;所述拓扑偏置随机游走表示为马尔可夫过程,其转移概率是游走偏置参数函数;将拓扑偏置随机游走引入到重启随机游走RWR中,通过调整偏置函数的参数,使得游走者优先访问或避开具有高拓扑属性值的节点;通过将基于拓扑偏置随机游走的RWR方法应用于描述多种基因相互作用关系的基因网络和多层异构生物网络;其中,基于BRWR的单层网络基因识别,方法如下:随机游走者在每个时间步骤上,或者从当前节点迭代地移动到其直接邻居,或者重启在具体的种子节点上;对于随机游走者的每次迭代,随机游走者以预先设定的概率r∈(0,1)在种子节点上重启,游走者将探索整个网络从而获得种子近邻的中心性排名;稳态概率给出了种子与网络中所有其它节点之间的中心性排名;用来获得候选基因中心性排名的RWR方法,优先访问生物网络中高度连接节点或中心节点;设p
i
(t)是给定时间步骤t下的特定节点i的时间相关概率变量,π
g
表示与基因网络相关的转移矩阵,有:从时间t到t+1的基因网络下BRWR如下:p(t+1)=(1

r)π
g
p(t)+rp0ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,p(t)=[p1(t),p2(t),

,p
N
(t)],p(t)表示在时间步骤t下有N个元素的向量,p0是种子节点的位置不等于零的初始概率向量;r是随机游走重启概率,r∈(0,1);经过多次迭代后,向量p(t+1)和向量p(t)之间的差异将变得忽略不计;通过调整偏置参数,概率将达到稳定状态;稳定概率p(∞)表示节点i到给定种子节点的中心性排名,如果p
i
(∞)>p
j
(∞),则节点i相较于节点j更加接近种子节点;基于BRWR的多层网络基因识别,方法如下:在非重启步骤中,相互连接多层网络上的随机游走者有两种行走情况:第一种是随机游走者从当前节点跳转到同一层的一个直接邻接节点,第二种是从当前节点跳跃其它层中的其对应的节点;其中,针对节点对齐和连接的基因多网络,该基因多网络由L个单层基因网络组成,每层分享同样的基因节点集V={1,2,

,N};每一单层基因网络α对应的邻接矩阵为A
α
,,表示邻接矩阵A
α
中一个元素;层之间连接所对应的矩阵为D
α,β
,它指示了层α中的节点和层β中同样节点之间的连接,其中,量化了从层α中节点i游走到层β中节点i的“代价”,将一个层间连接
基因多网络表示为一个超级邻接矩阵A
M
,即:其中,δ∈[0,1]控制随机游走在不同层之间跳跃或停留在同一层中的概率,如果δ=0,则随机游走者将会仅在同一层内移动;用A
M
(ij)取代式(1)中的g
ij
,同样能得到多层网络上随机游走者的偏置转移概率矩阵π
M
,将偏置重启随机游走BRWR方法引入多层网络BRWR

M,则式(2)变为:p
M
(t+1)=(1

r)π
M
p
M
(t)+rp
M0
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,p
M
(t)是一个具有NL成份的超向量,NL表示基因多网络总节点数;p
M
(t)=[p1(t),p2(t),

,p
L
(t)],它描述多层网络随机游走的概率分布,这些向量由每一层上节点的概率分布组成;p
M0
为重启向量,它描述每个层的初始概率分布,设p
M0
=τp0,参数τ量化了多层网络中每一层种子节点的重启概率,τ=[τ1,τ2,

,τ
L
,];通过修改参数τ来调整每一层的重要性;基于BRWR的多层异构网络基因识别,方法如下:将拓扑偏置重启随机游走BRWR方法引入到多层异构网络BRWR

MH;一个给定步骤的随机游走者,初始定位于多层网络中某一层的一个具体节点上;在下一个非重启步骤,随机游走者能够在相同的层内移动,或跳到其它层中与其对应的一样节点上,或借助基因

表型关联关系跳到另一个网络中;设一个有L层和N个蛋白质/基因节点组成的基因多网络,其对应的超级邻接矩阵A
M(NL
×
NL)
由式(3)得知;具有M个表型的表型网络,其对应邻接矩阵为A
P(M
×
M)
,并构建超级二分关联矩阵;根据二分的基因

表型关联关系,对应邻接矩阵为的多层二分网络将基因多网络每一层中的基因节点与表型节点关联起来;多层二分网络是由L个相同的异构二分网络组成,使用B
(N
×
M)
来描述所有的二分网络,并通过堆叠L个二分网络B
(N
×
M)
来创建一个与多层异构网络相关联的二分关联超邻接矩阵B
MP
,,表示一个向量或矩阵的转置;然后,构建多层异构网络所对应的全局邻接矩阵A
MH
,其中B
PM
是对应B
MP
的转置矩阵;同样计算BRWR在不同网络上的转移概率,以便将其引入到多层异构网络中;令R表示多层异构网络所对应的转移矩阵,其中,R
MM
和R
PP
分布表示位于基因多网络和表型网络内的随机游走的转移概率,R
MP
和R
PM
分别描述了基因多网络和表型网络之间的随机游走的跳跃概率;对于一个给定的节点,如果存在二分基因

表型关联关系,则随机游走者将在基因多网络和表型网络之间跳跃,或者以跳跃概率λ∈[0,1]停留在当前网络;跳跃概率λ控制着多层
异构网络中两个子网络的强化作用,λ值越大,网络间跳跃概率就越高,如果λ=0则基因和表型独立排名;设随机游走者位于多层异构基因网络中某一层的一个基因节点为g
i
,在下一时间步,随机游走者将按照以下两种方式之一跳跃:第一,按照以下的转移概率R
MM

【专利技术属性】
技术研发人员:丁苍峰王君张紫芸刘翼
申请(专利权)人:延安大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1