【技术实现步骤摘要】
一种基于单细胞转录组数据的转录因子调控网络建模方法
[0001]本专利技术属于生物技术行业领域,涉及一种利用单细胞组学数据解析多维分子协同调控机制的方法,具体地说,是一种利用多表型单细胞组学数据,基于多项非负矩阵因式分解算法框架,识别表型变化相关的转录因子
‑
基因功能协同调控互作机制的新方法。
技术介绍
[0002]近年来,受益于微流体芯片技术的发展,单细胞水平的组学测序技术在越来越多基础实验室和临床研究中得到推广应用。其中单细胞转录组测序技术(scRNA
‑
seq)因能通过转录表达谱反映单个细胞的即时生理状态,最为受到生物医学领域研究者的关注。随着scRNA
‑
seq技术测序深度和精度的不断优化以及一次性可测细胞数目的不断增多,scRNA
‑
seq不仅被用于不同细胞类型、细胞亚群的鉴定,细胞不同状态的区分,还被用于细胞谱系的追踪以及细胞在发育、分化等转化过程中关键特征的捕捉。虽然scRNA
‑
seq公共数据和工具都在井喷式增长,但目前只有零星研究对scRNA
‑
seq数据中的多维分子协同调控信息进行整合提取,尚无基于单细胞组学数据提取表型相关转录因子
‑
基因功能协同调控模块的方法及工具。
[0003]转录因子是生物体内调控细胞命运、发育模式和特定生物学功能的一类DNA结合蛋白,能通过特异性识别真核基因顺式作用元件来调控下游靶基因的转录或激活,进而促进生物表型或生理状态的变化。很多转录 ...
【技术保护点】
【技术特征摘要】
1.一种基于单细胞转录组数据的转录因子调控网络建模方法,其特征在于,包括步骤如下:S1.提取多表型单细胞组学数据,进行数据清洗,对清洗后的数据进行数据整合;S2.基于生物学知识库,对S1处理后的数据进行分析,构建先验的分子间互作关系网络;S3.基于多因子非负矩阵分解算法,根据S1处理后的数据和S2先验的分子间互作关系网络建立多维分子协同互作关系模块;S4.计算多维分子协同互作关系模块中与表型相关的互作关系模块;S5.对多维分子协同互作关系模块与表型相关的互作关系模块进行可视化导出。2.根据权利要求1所述一种基于单细胞转录组数据的转录因子调控网络建模方法,其特征在于,所述S1中数据清洗包括:S101设定过滤条件;所述过滤条件至少包括多表型单细胞组学数据中低丰富度的细胞、被细胞碎片污染的细胞、凋亡或裂解的细胞、多聚体中的一种;S102根据过滤条件对多表型单细胞组学数据进行过滤,获得过滤后的数据;S103对过滤后的数据进行特征识别,将识别后的数据进行数据整合;所述特征识别至少包括细胞分群、细胞特征基因识别。3.根据权利要求1所述一种基于单细胞转录组数据的转录因子调控网络建模方法,其特征在于,所述S2中分子间互作关系网络包括转录因子与靶基因之间的调控关系网络、基因与基因之间的功能关联网络。4.根据权利要求3所述一种基于单细胞转录组数据的转录因子调控网络建模方法,其特征在于,所述基因与基因之间的功能关联网络构建中关联基因至少参与包括调控同一生物学过程、参与同一基因通路、对同一表型有响应中的一种;所述基因与基因之间的功能关联网络中功能关联形式包括但不限于共表观遗传修饰的基因关联网络、基因编码蛋白的配受体互作关系网络、基因编码蛋白的蛋白质相互作用网络中的一种或多种。5.根据权利要求4所述一种基于单细胞转录组数据的转录因子调控网络建模方法,其特征在于,所述多因子非负矩阵分解算法为:S301设定观测到的总细胞数为n、观测到的总基因个数为m、观测到的总转录因子个数为s,建立一个n
×
m维的非负矩阵,设定为多表型的单细胞基因表达谱数据X1;建立一个n
×
s维的非负矩阵,设定为单细胞调控子活性矩阵数据X2;S302设定n个细胞中观察到的所有转录因子
‑
基因功能协同互作模块个数为k,建立一个n
×
k维的非负矩阵W;建立一个k
×
m维非负矩阵,用于描述低维空间中变量与基因之间的权重关系,设为H1;建立一个k
×
s维非负矩阵,用于描述低维空间中变量与转录因子之间的权重关系,设为H2;W满足X
I
≈WH
I
,H
I
≥0,W≥0,I=1,2...
【专利技术属性】
技术研发人员:李旭日,张嘉宁,
申请(专利权)人:中山大学中山眼科中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。