适用于多层谱系树的剪接表观遗传密码的获得方法技术

技术编号:35425204 阅读:17 留言:0更新日期:2022-11-03 11:27
本发明专利技术属于生物技术领域,具体涉及一种适用于多层谱系树的剪接表观遗传密码的获得方法,包括:获取谱系树中所有细胞类型的高通量测序数据;在epiSMINT基础上,将深度学习框架与树形结构相结合,建立树形结构神经网络模型deepiSMINT,将高通量测序数据数据输入树形结构神经网络模型,得到剪接表观遗传密码;其中,所述epiSMINT是基于混合高斯模型的概率生成模型;所述deepiSMINT由多层基于高斯混模型的神经网络依次堆叠而成,并基于谱系树中的细胞间亲子关系被组织成树形结构。本发明专利技术所获得的可变剪接表观遗传密码能够系统分析干细胞在分化成不同细胞系之间的命运决定机理。分化成不同细胞系之间的命运决定机理。分化成不同细胞系之间的命运决定机理。

【技术实现步骤摘要】
适用于多层谱系树的剪接表观遗传密码的获得方法


[0001]本专利技术属于生物
,具体涉及一种适用于多层谱系树的剪接表观遗传密码的获得方法。

技术介绍

[0002]谱系树(cell lineage tree)是由细胞分化过程及其形成的各子代细胞之间的关系组成的一个树形结构。谱系树作为多细胞生物最重要的表型之一,为追踪细胞分裂分化及细胞状态的时序变化提供了高效的数据表示和分析框架;它不仅是解决生命科学中许多发育有关重大问题的关键,也为发展计算技术和信息学方法来研究生物发育提供了重要手段。其中,干细胞(stem cell)谱系树是研究发育和细胞命运决定的最为重要的工具。
[0003]干细胞是一类多能(pluripotent)细胞,可以分化为形态结构、功能特征各不相同的细胞类群,并进而形成人体组织、器官和系统。干细胞持续的自我更新和多谱系分化是组织器官形成和个体发育的基础。干细胞不但是发育生物学的重要研究对象,更在临床应用领域有着广阔的前景。干细胞如何决定其在分化过程中的命运及其背后的调控机制是干细胞发育与器官再生领域最为关键科的学问题之一。因此,全面、系统、科学地研究干细胞的命运决定机制,将有助于深入理解器官发生和个体发育的生物学过程,并为细胞工程、再生医学及其临床应用提供理论基础。
[0004]伴随着细胞谱系树测定技术日新月异的发展,特别是近年基因编辑技术与单细胞测序技术的联合应用,细胞谱系树的数据呈现出快速积累的态势,基于谱系树的细胞状态建模与动态转移分析尤为重要,因为它是研究细胞命运决定机制的关键,且与发育生物学研究及临床应用直接关联。多组学的高通量测序技术,尤其是近年来不断发展的单细胞测序技术,为利用信息技术来研究细胞分化和命运决定提供了宝贵的资源。
[0005]鉴于可变剪接在干细胞自我更新、定向分化中的重要作用,阐释其精准调控机制将有助于进一步揭示干细胞的命运决定,并为细胞和组织工程以及再生医学提供理论基础。多年来,可变剪接调控一直被认为主要通过RNA结合蛋白(包括剪接因子和辅助蛋白)在可变剪接位点(splice site,SS)附近选择性结合pre

mRNAs,并通过基础剪接机器—剪接体(spliceosome)来调节其识别和剪接效率(Fiszbein A,Kornblihtt AR:Alternative splicing switches:Important players in cell differentiation.Bioessays 2017,39(6))。这些遗传水平的机制(genetic control)远不足以解释RNA剪接的精准调控。特别是同一个体的不同组织细胞在拥有完全相同的基因组和剪接因子表达的情况下,仍存在组织和发育阶段特异性的可变剪接模式。这表明存在额外的调控机制来更加精准的控制可变剪接的时空特异性。已有研究表明,除遗传机制外,由于可变剪接在转录开始不久便开始(即共转录过程),因此也会受到广泛存在于DNA和染色质上的表观遗传修饰的控制。表观遗传机制,如组蛋白修饰、DNA甲基化和核小体定位等,可以通过特定剪接因子招募和剪接位点识别来调控可变剪接过程。
[0006]表观遗传修饰为剪接模式提供了表观遗传记忆,使剪接模式在干细胞自我更新过
程中能够得以传递;同时,当干细胞定向分化而需要新的剪接模式时,该记忆又可被修改而无需建立新的剪接规则,便可得到特异性的剪接结果。现有技术已就人类胚胎干细胞(hESC)分化成不同组织细胞的过程,构建了包括RNA序列、剪接因子以及数十种组蛋白修饰在内的剪接表观遗传密码,称为DeepCode(Xu Yungang,Wang Y,Luo J,Zhao W,Zhou X:Deep learning of the splicing(epi)genetic code reveals a novel candidate mechanism linking histone modifications to ESC fate decision.Nucleic acids research 2017,45(21):12100

12112)。但是该文献仅仅考虑了成对细胞之间的比较,而未考虑更为复杂的谱系树结构;因此,其所获得的可变剪接表观遗传密码无法系统分析干细胞在分化成不同细胞系之间的命运决定机理。

技术实现思路

[0007]为了解决上述技术问题,本专利技术提供了一种适用于多层谱系树的剪接表观遗传密码的获得方法。
[0008]本专利技术的目的是提供一种适用于多层谱系树的剪接表观遗传密码的获得方法,包括:
[0009]获取谱系树中所有细胞类型的高通量测序数据;
[0010]在epiSMINT(epigenetic splicing module inference on tree)基础上,将深度学习框架与树形结构相结合,建立树形结构神经网络模型deepiSMINT,将高通量测序数据数据输入树形结构神经网络模型,得到剪接表观遗传密码;
[0011]其中,所述epiSMINT是基于混合高斯模型的概率生成模型;
[0012]所述deepiSMINT由多层基于高斯混模型的神经网络依次堆叠而成,并基于谱系树中的细胞间亲子关系被组织成树形结构。
[0013]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,所述epiSMINT由两部分组成:一是描述每种细胞状态的表观剪接模块;二是描述表观剪接模块在细胞代际间的状态转移的转移概率矩阵。
[0014]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,对于给定谱系树中的任意两个细胞,所述树形结构神经网络模型能从神经网络中寻找一条具有最大权重的路径,而路径上的神经元则表示对该路径起决定性作用的剪接表观遗传密码。
[0015]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,所述剪接表观遗传密码能解码谱系树中任意两细胞间分化路径上的关键剪接事件及其关联的表观遗传修饰。
[0016]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。
[0017]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。
[0018]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,将所述高通量测序数据先进行预处理,然后再建立概率生成模型。
[0019]优选的,上述适用于多层谱系树的剪接表观遗传密码的获得方法,所述高通量测序数据预处理方式如下:获取谱系树中每种细胞类型的已比对到转录组的RNA

seq数据,使
用rMATs软件检测谱系树中每个细胞类型的可变剪接事件,记录每个可变剪接区域的剪入百分比(percent spliced in,PSI),合并所有细胞类型鉴定的可变剪接事件,使得谱系树中每种细胞类型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,包括:获取谱系树中所有细胞类型的高通量测序数据;在epiSMINT基础上,将深度学习框架与树形结构相结合,建立树形结构神经网络模型deepiSMINT,将高通量测序数据数据输入树形结构神经网络模型,得到剪接表观遗传密码;其中,所述epiSMINT是基于混合高斯模型的概率生成模型;所述deepiSMINT由多层基于高斯混模型的神经网络依次堆叠而成,并基于谱系树中的细胞间亲子关系被组织成树形结构。2.根据权利要求1所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,所述epiSMINT由两部分组成:一是描述每种细胞状态的表观剪接模块;二是描述表观剪接模块在细胞代际间的状态转移的转移概率矩阵。3.根据权利要求1所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,对于给定谱系树中的任意两个细胞,所述树形结构神经网络模型能从神经网络中寻找一条具有最大权重的路径,而路径上的神经元则表示对该路径起决定性作用的剪接表观遗传密码。4.根据权利要求1所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,所述剪接表观遗传密码能解码谱系树中任意两细胞间分化路径上的关键剪接事件及其关联的表观遗传修饰。5.根据权利要求1所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,所述谱系树为人类胚胎干细胞分化谱系树、造血干细胞分化谱系树或者诱导多能干细胞分化谱系树。6.根据权利要求1所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,所述高通量测序数据包括基因组、转录组和表观遗传组的高通量测序数据。7.根据权利要求6所述的适用于多层谱系树的剪接表观遗传密码的获得方法,其特征在于,将所述高通量测序...

【专利技术属性】
技术研发人员:徐云刚邹权杨娟刘薇李如风李康郭中昊张栩瑞强敏张恩永
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1