当前位置: 首页 > 专利查询>武汉大学专利>正文

一种动态基因调控网的网络演化分析方法及装置制造方法及图纸

技术编号:20392669 阅读:27 留言:0更新日期:2019-02-20 03:59
本发明专利技术提供了一种动态基因调控网的网络演化分析方法及装置,其中的方法对动态基因调控网网络演化的研究分成两个步骤来进行,首先对基因调控网中模体的转换进行了研究,将现有对基因调控网的研究扩展到了动态的领域,能够更好的捕捉到基因调控网的演化模式,其次通过基于隐空间特征的符号判别算法对将来时刻基因调控网快照的连边符号进行了判别,将研究领域扩展到带符号网络。实现了对动态基因调控网的演化分析,改善了预测效果。

【技术实现步骤摘要】
一种动态基因调控网的网络演化分析方法及装置
本专利技术涉及计算机科学和生物网络
,具体涉及一种动态基因调控网的网络演化分析方法及装置。
技术介绍
在生物体内,基因通过表达和调控相互作用,从而实现它们的生物学功能,并完成复杂的生命活动。基因间的相互作用是一个连续而复杂的动态过程,随着时间、环境的变化而变化。对基因调控网网络演化的研究有许多重要意义,例如可以通过当前的基因调控关系预测未来的基因调控关系,还可以通过基因调控关系的变化预测基因功能的变化,从而探明某些疾病尤其是癌症的发病机制、为疾病的预测和治疗提供依据等。目前,在基因调控网网络演化的研究中,生物医学领域的研究者和计算机科学的研究者分别从不同的角度对基因调控网的网络演化进行了分析。网络演化与链路预测具有内在的一致性,通过链路预测算法可以对网络演化模型的正确性进行验证。传统的链路预测方法主要分为三类:基于相似性的链路预测、基于最大似然估计的链路预测以及概率模型的链路预测方法。其中,基于相似性的链路预测算法包括共同邻居算法(CN)、AA算法等。基于最大似然估计的链路预测方法通过似然估计值和马尔可夫-蒙特卡洛算法得到两节点之间产本文档来自技高网...

【技术保护点】
1.一种动态基因调控网的网络演化分析方法,其特征在于,包括:步骤S1:将基因调控网以模体的形式进行表示,统计快照间的模体转换概率,并将相邻两个快照间的模体转换概率用矩阵表示,得到模体转换概率矩阵,模体为由三个节点构成的子图,快照为以预设时间间隔对基因调控网络进行采样,得到的预设时刻的静态结构,模体转换概率矩阵中的元素用以表征模体从一个时刻到下一时刻的变化情况;步骤S2:以包含前T‑1个时刻的模体转换概率矩阵的模体转换概率张量为基础,预测t时刻的模体转换概率矩阵,获得无符号的网络快照,其中,T表示快照的总数量,t表示时刻;步骤S3:对源网络和目标网络的连边分别提取显式特征和隐式特征,其中,源网络...

【技术特征摘要】
1.一种动态基因调控网的网络演化分析方法,其特征在于,包括:步骤S1:将基因调控网以模体的形式进行表示,统计快照间的模体转换概率,并将相邻两个快照间的模体转换概率用矩阵表示,得到模体转换概率矩阵,模体为由三个节点构成的子图,快照为以预设时间间隔对基因调控网络进行采样,得到的预设时刻的静态结构,模体转换概率矩阵中的元素用以表征模体从一个时刻到下一时刻的变化情况;步骤S2:以包含前T-1个时刻的模体转换概率矩阵的模体转换概率张量为基础,预测t时刻的模体转换概率矩阵,获得无符号的网络快照,其中,T表示快照的总数量,t表示时刻;步骤S3:对源网络和目标网络的连边分别提取显式特征和隐式特征,其中,源网络为符号已知的网络,目标网络为基因调控网,并基于隐式特征,将无符号的基因调控网的边通过预设非负矩阵三因式分解的方法映射到隐空间中,以连边在隐空间位置的坐标为特征、连边的符号为标签,通过机器学习方法进行样本的训练和预测,获得未来时刻的有符号的网络快照。2.如权利要求1所述的方法,其特征在于,步骤S1具体包括:步骤S1.1:将网络中所有节点每三个组成一组,进行分组和编号,每组为一个模体,根据三个节点间连边的不同,共有64种基本模体类型;步骤S1.2:将相邻两个快照间模体转换概率用一个64×64的矩阵进行表示,称为模体转换概率矩阵,记作TCM,其中,矩阵中元素的值TCMt(i,j)=P(trit[i]→trit[j])表示从t时刻到t+1时刻编号为i的模体转换为编号为j的模体的概率,其中trit[i]表示t时刻编号为i的模体;步骤S1.3:将不同时刻的模体转换概率矩阵合成模体转换概率张量(TCT),其中,TCT=(TCM1,TCM2,…,TCMT-1),张量中的元素TCT(i,j,t)=TCMt(i,j)。3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:步骤S2.1:对模体转换概率张量进行非负张量分解,分解得到三个因式矩阵A,B,C,其中ABT表示不同类型模体间的转换关系,C包含上述转换关系在时间维度上的信息,称为时间因式矩阵;步骤S2.2:采用指数分布模型预测时间因式矩阵的第T行,计算方式如下:其中,T为常量,表示快照的总数量,t为变量,表示从1到T中的某一个时刻,a表示权重参数,r表示矩阵A、B、C的一列,若共有R列,则r取值为1到R之间的任意整数;步骤S2.3:根据预测得到的T时刻的时间因式矩阵获得T时刻的模体转换概率矩阵,称为模体转换似然矩阵(TCLM),计算方式如下:其中,λr为非负张量分解的结果,为已知数,A(i,r)为矩阵A的第i行第r列元素,B(j,r)为矩阵B的第j行第r列元素,C(T,r)为矩阵C的第T行第r列元素。4.如权利要求1所述的方法,其特征在于,步骤S3具体包括:步骤S3.1:对连边进行特征提取并映射到隐空间中,提取的特征包括显式特征和隐式特征,对一个有向边(u,v),显式特征包括节点的度数、中介中心性,模体个数以及共同邻居,对一个有向边(u,v),通过非负矩阵三因式分解的方法提取其隐式特征,具体的提取方式如下:其中,||·||F为弗罗贝尼乌斯范数,M为基因调控网的规模,Us,Vs,Ut,Vt是提取出的四个隐空间特征矩阵,Us,Vs,Ut,Vt为提取出的四个隐空间特征矩阵,Us的第d行代表源网络第d个节点作为边的出节点的特征向量,Vs的第d行代表源网络d个节点作为边的入节点的特征向量,Ut第d行代表目标网络第d个节点作为边的出节点的特征向量,Vt的第d行代表目标网络d个节点作为边的入节点的特征向量,α为正则化系数,Σk为正则项参数,目标函数的作用为寻找合适的...

【专利技术属性】
技术研发人员:胡文斌刘中舟许平华高旷陈沐坤
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1