System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于矩阵增强和特征融合的基因调控关系预测方法技术_技高网
当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于矩阵增强和特征融合的基因调控关系预测方法技术

技术编号:40825840 阅读:3 留言:0更新日期:2024-04-01 14:47
本发明专利技术公开了一种基于矩阵增强和特征融合的基因调控关系预测方法,包括:1、获取N个基因G及其调控关系R,2、根据R计算基因的有向邻接矩阵,3、生成源基因的相似性矩阵并归一化,4、生成靶基因的相似性矩阵并归一化,5、采用EASNN方法分别对归一化后的源基因和靶基因相似性矩阵进行处理,并对邻接矩阵进行矩阵增强处理,6、生成基因的协方差矩阵Co,并根据Co选择任一基因对的邻域基因对集合,7、根据G得到各个基因对的总直方图集合Mg,8、得到各个基因对的总增强直方图集合Ma,9、构建CNN网络得到各个基因对之间存在调控关系的概率。本发明专利技术能有效融合基因表达特征和增强的网络结构特征,从而能更加准测的预测基因之间的调控关系。

【技术实现步骤摘要】

本专利技术属于基因调控关系预测领域,具体的说是一种基于矩阵增强和特征融合的基因调控关系预测方法


技术介绍

1、对于细胞来说,转录调节是非常重要的,它允许细胞适应不断变化的环境,并且对外界刺激做出反应来动态的调节基因的表达。转录因子(tf)通过调控自身及其对应靶基因(tg)发挥作用,转录因子与靶基因以及他们之间的相互作用构成了基因调控网络(grn)。基因调控网络(grn)旨在捕捉转录因子和靶基因这些实体分子之间的依赖关系。基因调控网络通过控制基因表达在生物体的生长发育中有着至关重要的作用,具体表现为:grn是维持生命过程、控制生化反应、调节化合物水平等的核心元素,在各种生物体和系统中发挥着重要作用。因此,准确的构建grn可以提高我们对基因的调控机制以及生物体分子机制的理解。

2、为了更好的了解基因间的调控机制,近年来开发了很多算法用于grn的构建:基于信息论的方法以基因的相关性为基础来量化基因之间的统计依赖性,从得到的基因间的相关矩阵中来预测grn的结构。基于布尔网络的方法是将使用布尔变量来表示基因的状态,然后使用布尔函数来计算基因之间的关系,可以捕捉到基因之间的动态相互作用。特征选择也逐渐应用于推断grn,例如genie3、dyngenie3、jump3、bixgboost等方法。随着深度学习的发展,越来越多的深度学习方法应用于grn推断,例如cnn、tdl、deepdrim等方法。

3、上述方法都是从基因表达数据中提取特征并完成预测,忽略了grn中丰富的网络结构信息。与单一使用基因表达特征相比,整合基因表达特征和网络结构特征可以显著提高grn预测的准确性。然而由grn生成的邻接矩阵是非常稀疏的,会影响最终的预测结果。cnn对于处理图像数据的特征提取具有很强的能力。在提取基因的网络结构特征时,如果将邻接矩阵直接作为cnn的输入,可能对预测效果产生一定的影响。


技术实现思路

1、本专利技术是为了解决上述现有技术存在的不足之处,提出一种基于矩阵增强和特征融合的基因调控关系预测方法,以期能有效融合基因表达特征和增强的网络结构特征,从而能更加准确的预测基因之间的调控关系。

2、本专利技术为达到上述专利技术目的,采用如下技术方案:

3、本专利技术一种基于矩阵增强和特征融合的基因调控关系预测方法的特点在于,是按照如下步骤进行:

4、步骤1、获取n个基因g={g1,g2,...,gi...,gn}及其调控关系r,且任意第i个基因gi包含m个基因表达值;i∈[1,n];

5、步骤2、根据调控关系r计算基因的有向邻接矩阵adj={adj1,1,adj1,2,...,adjc,k...,adjn,n},其中,adjc,k代表第c个基因gc是否调控第k个基因gk,若调控,则令adjc,k=1,否则,令adjck=0;c,k∈[1,n];

6、鉴于r具有有向性,将基因分别视为源基因或者靶基因进行相应处理;

7、步骤3、生成源基因的相似性矩阵并归一化后,得到归一化后的源基因相似性矩阵rs={rs(s1,s1),rs(s1,s2),...,rs(sc,sk),...,rs(sn,sn)},其中,sc代表第c个源基因,sk代表第k个源基因,rs(sc,sk)代表第c个源基因sc与第k个源基因sk的相似度,c,k∈[1,n];

8、步骤4、生成靶基因的相似性矩阵并归一化后,得到归一化后的靶基因相似性矩阵rt={rt(t1,t1),rt(t1,t2),...,rt(tc,tk),...,rt(tn,tn)},其中,tc代表第c个靶基因,tk代表第k个靶基因,rt(tc,tk)代表第c个靶基因tc与第k个靶基因tk的相似度;c,k∈[1,n];

9、步骤5、将rs和rt以及adj共同输入到easnn方法中,对adj进行矩阵增强处理,得到增强后的邻接矩阵meadj={meadj1,1,meadj1,2,...,meadjc,k...,meadjn,n},其中,meadjc,k代表第c个基因gc调控第k个基因gk的概率,meadjc,k∈[0,1];

10、步骤6、由n个基因g生成基因的协方差矩阵co={co1,1co1,2,...,coc,k...,con,n};其中,coc,k表示第c个基因gc和第k个基因gk之间的协方差值;

11、根据co选择与第c个基因gc之间的正协方差值排名前b位的基因作为第c个基因gc的邻域基因,记为{gc,1,gc,2,...,gc,b,...,gc,b},gc,b表示第c个基因gc的第b个邻域基因;将第c个基因gc分别与其邻域基因构成基因对{(gc,gc,1),(gc,gc,2),...,(gc,gc,b),...,(gc,gc,b)};

12、根据co选择与第k个基因gk之间的正协方差值排名前b位的基因作为第k个基因gk的邻域基因,记为{gk,1,gck,2,...,gk,b,...,gk,b},gk,b表示第k个基因gk的第b个邻域基因;将第k个基因gk分别其邻域基因构成基因对{(gk,gk,1)(gk,gk,2),...,(gk,gk,b),...,(gk,gk,b)};

13、将第c个基因gc和第k个基因gk分别与自身构成基因对{(gc,gc),(gk,gk)};

14、由{(gc,gc),(gk,gk),(gc,gc,1),(gc,gc,2),...,(gc,gc,b),(gk,gk,1),(gk,gk,2),...,(gk,gk,b)}构成第c个基因gc和第k个基因gk之间基因对(gc,gk)的邻域基因对集合;

15、步骤7、生成第c个基因gc与第k个基因gk之间的直方图mg′c,k;

16、生成第c个基因gc和第k个基因gk之间的邻域基因对集合对应的邻域直方图集合mg″c,k;由mg′c,k和mg″c,k构成基因对(gc,gk)的总直方图mgc,k,从而得到各个基因对的总直方图集合mg={mg1,1,mg1,2,...mgc,k,...,mgn,n};

17、步骤8、根据第c个基因gc与所有基因的调控的概率构成的集合{meadjc,1,meadjc,2,...,meadjc,n}和第k个基因gk与所有基因的调控的概率构成的集合meadjk,1,meadjk,2,...,meadjk,n}生成第c个基因gc与第k个基因gk之间的增强直方图ma′c,k;

18、生成第c个基因gc和第k个基因gk之间的邻域基因对集合对应的增强邻域直方图集合ma″c,k,由ma′c,k和ma″c,k构成基因对(gc,gk)的总增强直方图mac,k,从而得到各个基因对的总增强直方图集合ma={ma1,1,ma1,2,...,mac,k,...,man,n};

19、步骤9、构建cnn网络,包括:卷积池化层、全连接层、融合层、输出层;

20、所述卷积池化层对mg和ma进行处理,并得到基因表达特征张量本文档来自技高网...

【技术保护点】

1.一种基于矩阵增强和特征融合的基因调控关系预测方法,其特征在于,是按照如下步骤进行:

2.根据权利要求1所述的基因调控关系预测方法,其特征是,所述步骤3是按如下过程生成源基因相似性矩阵:

3.根据权利要求2所述的基因调控关系预测方法,其特征是,所述步骤5中的EASNN方法是按照如下步骤进行:

4.根据权利要求3所述的一种基因调控网络构建方法,其特征在于,所述步骤7中是按如下过程生成直方图:

5.根据权利要求4所述的一种基因调控网络构建方法,其特征在于,所述步骤9中的融合层是将uMg和uMa中对应元素相乘后,得到初始融合特征U,对U进行卷积池化处理得到局部融合特征U′,同时将U展平后得到展平特征U″,最后将拼接U′和U″后输入另一个全连接层中的处理,从而得到融合特征V。

6.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-5所述基因调控关系预测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

7.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-5所述基因调控关系预测方法的步骤。

...

【技术特征摘要】

1.一种基于矩阵增强和特征融合的基因调控关系预测方法,其特征在于,是按照如下步骤进行:

2.根据权利要求1所述的基因调控关系预测方法,其特征是,所述步骤3是按如下过程生成源基因相似性矩阵:

3.根据权利要求2所述的基因调控关系预测方法,其特征是,所述步骤5中的easnn方法是按照如下步骤进行:

4.根据权利要求3所述的一种基因调控网络构建方法,其特征在于,所述步骤7中是按如下过程生成直方图:

5.根据权利要求4所述的一种基因调控网络构建方法,其特征在于,所述步骤9中的融合层是将umg和uma中...

【专利技术属性】
技术研发人员:郑春厚鲍锦锦魏丕静高震曹瑞芬
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1