一种基于多视角分层超图的基因调控网络推断方法技术

技术编号:39045817 阅读:12 留言:0更新日期:2023-10-10 11:58
本发明专利技术公开一种基于多视角分层超图的基因调控网络推断方法,属于图表示学习技术领域。为解决现有基于图表示学习的基因调控网络推断方法缺乏集成异质生物信息,无法建模基因间复杂高阶调控模式的问题,本发明专利技术通过构建多视角分层超图集成多元异构生物信息,再捕获基因间的高阶调控信息,扩散机制和域间信息传递机制,最后用于下游的基因调控网络推断任务。本发明专利技术能有效整合基因调控网络的结构信息和基因表达特性,生成更加全面的基因特征表示,进而缓解对有限先验调控知识的依赖问题,提升模型跨物种推断的泛化能力,可以更加细粒度的刻画基因调控特征,有助于阐明调控机制发挥作用的过程,提升潜在调控关系的预测性能。提升潜在调控关系的预测性能。提升潜在调控关系的预测性能。

【技术实现步骤摘要】
一种基于多视角分层超图的基因调控网络推断方法


[0001]本专利技术涉及一种基于多视角分层超图的基因调控网络推断方法,属于图表示学习、系统生物学等


技术介绍

[0002]基因调控网络是以上游转录因子以及下游靶基因为节点,转录因子与靶基因之间的调控关系作为边的一种逻辑映射网络,其描述了细胞发育和稳态的重要过程。利用单细胞转录组数据准确地重构基因调控网络是系统生物学中的一项长期挑战。
[0003]随着高通量测序技术的空前发展,大量的单细胞转录组数据以及经过验证的高置信度先验调控知识为基因调控网络的准确推断奠定了基础。利用深度学习技术对海量的基因表达谱数据进行共表达分析,能有效地识别潜在的转录因子

靶基因关系,获得了远超无监督方法的预测性能,证明了先验调控关系的重要性。
[0004]基因调控网络作为一种天然的图结构数据,能对基因间复杂的调控过程进行形式化描述。因此,利用图神经网络对基因间成对调控关系进行的建模表征,并通过多层网路的迭代捕获基因调控网络的局部以及全局特征,可以提升潜在调控关系推断的准确率。
[0005]然而,基因调控是多个基因同时发挥作用的过程,现有基于图神经网络的调控关系推断算法仅将转录因子

靶基因交互视为成对关系,无法建模基因间普遍存在的多对多高阶复杂调控关系。同时,该类方法往往依赖于有限的先验调控知识,忽略了基因表达谱中的结构信息,从而影响基因调控网络重构的准确性。

技术实现思路

[0006]针对现有基于图表示学习的基因调控网络推断方法缺乏集成异质生物信息,无法建模基因间复杂高阶调控模式的问题,本专利技术提供一种基于多视角分层超图的基因调控网络推断方法。
[0007]本专利技术通过下列技术方案实现:一种基于多视角分层超图的基因调控网络推断方法。该方法将基因调控先验知识与基因共表达关系等多视角异构信息视为合作关系,共同指导基因调控网络的重构,将多类型转录因子

靶基因二部图转换为转录因子、靶基因多视角分层超图。然后,为了建模基因间的多对多关系,引入超图卷积神经网络对基因调控网络中的复杂调控模式进行表征。同时,为了获取更优的节点表示,利用域内耦合信息扩散机制建模同一节点在多视角分层超图下的相似性,利用域间信息传播机制建模同一交互类型下转录因子和靶基因的相似性。最后,利用通道注意力机制自适应学习不同视角下的基因嵌入表示,获取转录因子和靶基因的最终嵌入表示,用于基因调控网络的推断。
[0008]具体步骤如下:
[0009]Step1、整合基因表达谱数据以及先验调控知识,构建多视角转录因子

靶基因二部图:
[0010]Step1.1、利用皮尔逊相关系数和斯皮尔曼相关系数对单细胞转录组测序数据进
行共表达分析:给定一个转录因子和一个靶标基因,将表达关联性分析函数定义为,,基于皮尔逊相关系数与斯皮尔曼相关系数的关联性分析阈值均设为0.8,基因间广泛的共表达交互关系构成共表达网络,其邻接矩阵表示为:
[0011](1)
[0012]其中,为基因共表达网络邻接矩阵的实体化表示,为基于基因表达谱数据进行共表达分析所使用的相关系数类型;
[0013]Step1.2、利用先验调控信息构建转录因子

靶基因调控二部图:将基因共表达网络中蕴含的基因表达关联与先验调控关系整合为一个多视角二部图;其中,表示N个转录因子的集合,表示M个靶基因的集合,,表示第个转录因子

靶基因二部图边的集合,表示本专利技术中包含类转录因子

靶基因交互;
[0014]Step2、将多视角基因交互二部图分别转换为转录因子、靶基因多视角分层超图:对于任意的转录因子和靶基因,其邻居节点为分别为和,利用超边连接节点及其所有邻居节点,得到第个视角下,转录因子

靶基因二部图所对应的转录因子超图和靶基因超图;重复以上操作次,最终得到转录因子多视角分层超图和靶基因多视角分层超图:
[0015](2)
[0016]Step3、基于构建的多视角分层超图,利用超图卷积神经网络建模转录因子

靶基因多对多高阶调控关系,超图卷积算子的定义如下所示:
[0017](3)
[0018]其中,为第层网络的第个视角下转录因子的特征表示矩阵,和分别为节点度矩阵和超边度矩阵,为超图关联矩阵,为单位矩阵,表示可学习的滤波器参数矩阵,其中和分别为超图卷积神经网络第层和层的输出维度;
[0019]Step3.1、通过迭代层超图卷积算子操作,可以得到转录因子多视角低维嵌入表示和靶基因多视角低维嵌入表示;
[0020]Step4、为了优化基因嵌入表示,利用域内耦合信息扩散机制、域间信息传递机制促进域内、域间基因信息共享;
[0021]Step4.1、利用域内耦合信息扩散机制对不同视角下的同一节点相似性进行建模,以转录因子多视角分层超图为例,耦合信息扩散层的关联矩阵为,其元素表示
为:
[0022](4)
[0023]其中,包含了转录因子节点在不同视角下所有的超边交互,表示超边;
[0024]在第层超图卷积网络下,多视角分层超图间耦合信息扩散机制描述为:
[0025](5)
[0026]其中,为节点度矩阵,为超边度矩阵,表示可学习的转换矩阵,为第层网络的转录因子特征表示输出矩阵,为不同视角分层超图数目。
[0027]Step4.2、利用域间信息传递机制建模同一交互类型下转录因子和靶基因之间的相关性,其定义如下:
[0028](6)
[0029]其中,为第层网络的第个超图下转录因子的低维嵌入表示,为第层网络的第个超图下靶基因的低维嵌入表示,和为关联矩阵的转置表示,和表示可学习的转换矩阵;
[0030]Step4.3、通过层网络的迭代,第个分层超图下转录因子和靶基因的嵌入表示如下所示:
[0031](7)
[0032]Step4.4、利用通道注意力机制自适应学习基因多视角嵌入表示;
[0033]Step4.4.1、首先在空间维度对基因特征表示进行全局池化和平均池化的压缩,特征压缩的定义如下:
[0034](8)
[0035]其中,为第层网络多个视角下转录因子的低维嵌入表示,为第层网络多个视角下靶基因的低维嵌入表示,压缩后的转录因子和靶基因特征表示分别为、;然后,采用一维卷积计算各通道的注意力分数,并通过激活层对注意力分数进行归一化:
[0036](9)
[0037]其中,,,表示一维卷积,为卷积核的尺寸,为激活函数;
[0038]Step4.4.2、最后,将各通道原始特征与其对应的通道注意力分数相乘,并将每个通道的特征求和,得到转录因子和靶基因最终的嵌入表示:
[0039](10)
[0040]其中,是转录因子的最终嵌入表示,是靶基因的最终嵌入表示,和为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多视角分层超图的基因调控网络推断方法,其特征在于:集成多元异质生物信息构建多类转录因子

靶基因二部图,将基因交互二部图转换为转录因子、靶基因分层超图;然后,利用超图卷积神经网络捕获高阶调控特征,并通过域内信息扩散机制建模不同视角下域内节点间相似性,利用域间信息传递机制建模转录因子和靶基因间相似性;最后,利用独特的通道注意力机制自适应学习不同视角下基因嵌入表示,并基于转录因子嵌入表示和靶基因嵌入表示预测交互概率,完成潜在调控关系推断。2.根据权利要求1所述的一种基于多视角分层超图的基因调控网络推断方法,其具体步骤如下:Step1、整合基因表达谱数据以及先验调控知识,构建多视角转录因子

靶基因二部图;Step1.1、利用皮尔逊相关系数和斯皮尔曼相关系数对单细胞转录组测序数据进行共表达分析:给定一个转录因子和一个靶标基因,将表达关联性分析函数定义为,,基于皮尔逊相关系数与斯皮尔曼相关系数的关联性分析阈值均设为0.8,基因间广泛的共表达交互关系构成共表达网络,其邻接矩阵表示为:(1);其中,为基因共表达网络邻接矩阵的实体化表示,为基于基因表达谱数据进行共表达分析所使用的相关系数类型;Step1.2、利用先验调控信息构建转录因子

靶基因调控二部图:将基因共表达网络中蕴含的基因表达关联与先验调控关系整合为一个多视角二部图,其中,表示N个转录因子的集合,表示M个靶基因的集合,,表示第个转录因子

靶基因二部图边的集合,表示本发明中包含类转录因子

靶基因交互;Step2、将多视角基因交互二部图分别转换为转录因子、靶基因多视角分层超图:对于任意的转录因子和靶基因,其邻居节点为分别为和,利用超边连接节点及其所有邻居节点,得到第个视角下,转录因子

靶基因二部图所对应的转录因子超图和靶基因超图;重复以上操作次,最终得到转录因子多视角分层超图和靶基因多视角分层超图:(2)Step3、基于构建的多视角分层超图,利用超图卷积神经网络建模转录因子

靶基因多对多高阶调控关系,超图卷积算子的定义如下所示:(3);其中,为第层网络的第个视角下转录因子的特征表示矩阵,和
分别为节点度矩阵和超边度矩阵,为超图关联矩阵,为单位矩阵,表示可学习的滤波器参数矩阵,其中和分别为超图卷积神经网络第层和层的输出维度;Step3.1、通过迭代层超图卷积算子操作,可以得到转录因子多视角低维嵌入表示和靶基因多视角低维嵌入表示;Step4、为了优化基因嵌入表示...

【专利技术属性】
技术研发人员:唐明靖吴松阳金魁
申请(专利权)人:云南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1