一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法技术

技术编号:33305405 阅读:17 留言:0更新日期:2022-05-06 12:14
本发明专利技术提供了一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法,属于生物信息技术领域。本发明专利技术的方法基于植物转录因子的DAP

【技术实现步骤摘要】
一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法


[0001]本专利技术属于生物信息
,具体涉及一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法。

技术介绍

[0002]真核生物转录起始过程十分复杂,往往需要多种蛋白因子协助,转录因子与RNA聚合酶Ⅱ形成转录起始复合体,能够与基因启动子区域的顺式作用元件发生互作的DNA结合蛋白,共同参与转录起始过程。转录因子(TF)广泛存在于真核生物基因组中,并且是生物中最重要的调控因子,在真核生物基因组基因中约有6%是TF基因,虽然比例不高但几乎参与全部基因的转录调控过程。TF由多个基因家族组成,其中在植物中,目前研究较为广泛的有MYB、NAC、WRKY、ARF和GRF等转录因子。
[0003]根据TF的作用特点可分为二类;第一类为普遍TF,它们与RNA聚合酶Ⅱ共同组成转录起始复合体时,转录才能在正确的位置启始。第二类转录因子为组织细胞特异性转录因子,这些TF在特异的组织、细胞或是受到一些类固醇激素\生长因子或其它刺激后,开始表达某些特异蛋白质分子时,才需要该类转录因子。这两类转录因子目前发现都需要和基因的启动子结合才能发挥作用。当前的研究表明,转录因子的表达调控不仅在植物生长发育和细胞的形态等生理活动中发挥重要的调控作用,而且还与植物次生代谢调控和抗逆过程密切相关。因此,对转录因子的表达调控研究具有重要且广泛的意义。并且近些年来研究发现,在重要的经济作物和林木中,转录因子调控机制的研究对于优良品种的选育工作有着重要的指导作用。r/>[0004]现阶段的植物转录因子下游调控靶基因的筛选预测方法主要基于转录因子的结合特征,利用生物信息学软件,对结合位点进行预测,将符合条件的候选基础序列(motif)与已经通过实验验证的同源结合位点进行分析比较,最终确定该物种调控的启动子motif序列,并通过结合位点预测下游调控基因。但是现阶段的预测方法存在效率低下的问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法,本专利技术的方法能够快速预测出靶基因。
[0006]本专利技术提供了一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法,包括以下步骤:
[0007]1)将携带目标转录因子的植物材料作为处理样品,将不携带目标样品的植物材料作为对照样品;分别提取所述处理样品和对照样品的植物基因组DNA,打断所述植物基因组DNA,得到DNA片段,以所述DNA片段分别建立处理样品和对照样品的DNA文库;
[0008]2)构建目标转录因子的DAP

seq体外蛋白表达载体,得到重组质粒,表达所述重组质粒,得到蛋白表达溶液;
[0009]3)将所述蛋白表达溶液和蛋白质融合标签第一混合后,再分别与处理样品和对照样品的DNA文库第二混合,得到处理样品溶液和对照样品溶液,筛选所述处理样品溶液和对照样品溶液中与重组蛋白结合的DNA序列进行测序,分别得到处理样品和对照样品的测序结果;
[0010]4)分别对所述处理样品和对照样品的测序结果进行预处理,分别得到处理样品和对照样品的待分析数据;所述预处理包括进行质控,过滤掉低质量的序列;
[0011]5)将所述处理样品和对照样品的待分析数据分别与参考基因组进行比对,分别得到处理样品和对照样品的BAM文件;
[0012]6)对所述处理样品和对照样品的BAM文件进行Peak

Calling分析,得到目标转录因子在全基因组范围内富集的位置信息;
[0013]7)根据所述目标转录因子在全基因组范围内富集的位置信息,确定待分析序列,对所述待分析序列进行Homer

MotifsPeaks分析,筛选得到目标转录因子调控的基础序列;
[0014]8)根据所述目标转录因子在全基因组范围内富集的位置信息,利用IGV对目标转录因子的结合峰进行可视化分析;
[0015]9)对步骤7)得到的目标转录因子调控的基础序列进行全基因组基因的启动子比对,比对得到调控下游关键靶基因;
[0016]步骤1)和步骤2)之间没有时间顺序限制;
[0017]所述步骤7)和步骤8)之间没有时间顺序限制。
[0018]优选的,步骤1)中,打断所述植物基因组DNA至片段大小为250bp。
[0019]优选的,步骤1)中,所述植物材料为无性系植物材料。
[0020]优选的,步骤5)中,利用Bowtie2将所述处理样品和对照样品的待分析数据分别与参考基因组进行比对。
[0021]优选的,步骤6)中,采用MACS2.0软件对处理样品和对照样品的BAM文件进行Peak

Calling分析。
[0022]优选的,步骤6)中,所述Peak

Calling分析包括:去除处理样品和对照样品中重叠的片段,保留差异片段,所述差异片段的位置信息为目标转录因子在全基因组范围内富集的位置信息。
[0023]优选的,步骤7)中,所述目标转录因子调控的基础序列的大小为20bp或30bp。
[0024]优选的,在步骤7)筛选得到目标转录因子调控的基础序列后,还包括以筛选得到的转录因子调控的基础序列作为候选基础序列元件,对所述候选基础序列元件进行分析,过滤假阳性结果,得到校正后的下游调控基础序列元件;所述分析的方法包括:多数据富集分析和多序列比对分析。
[0025]优选的,本专利技术在得到校正后的下游调控Motif元件后,还包括以包含所述Motif元件的启动子基因作为下游调控基因,将所述下游调控基因归类为不同的家族和进行GO富集分析。
[0026]本专利技术提供了一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法,本专利技术的方法基于植物转录因子的DAP

seq测序数据,利用MACS2.0软件在全基因组中检测调控的启动子的基础序列(Motif)元件和位置,并以此为基础,预测转录因子调控的下游靶基因。本专利技术联合测序数据和生物信息学工具,大大增加了预测的精确度和
通量,进而可在大数据量的基础上快速预测出靶基因,提高预测效率。并且本专利技术的方法普遍适用于植物学领域。
[0027]此外,现阶段的植物转录因子下游调控靶基因的筛选预测方法是利用免疫共沉淀技术挖掘转录因子的调控的靶基因,但是该技术需要商业化的抗体,本专利技术的方法可以不依赖商业化的抗体,能够提高预测和研究的效率。
附图说明
[0028]图1为本专利技术实施例中在全基因组水平上预测植物转录因子靶基因的方法的流程图;
[0029]图2为双端测序的结构示意图;横坐标:0点代表的转录起始位点,纵坐标:富集片段在总片段的百分比;
[0030]图3表示转录因子调控的启动子Motif区域的位置分布;
[0031]图4表示杨树转录因子调控的启动子Motif,其中A为P值最高的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种在全基因组水平上预测植物生长发育转录因子调控的下游靶基因的方法,包括以下步骤:1)将携带目标转录因子的植物材料作为处理样品,将不携带目标样品的植物材料作为对照样品;分别提取所述处理样品和对照样品的植物基因组DNA,打断所述植物基因组DNA,得到DNA片段,以所述DNA片段分别建立处理样品和对照样品的DNA文库;2)构建目标转录因子的DAP

seq体外蛋白表达载体,得到重组质粒,表达所述重组质粒,得到蛋白表达溶液;3)将所述蛋白表达溶液和蛋白质融合标签第一混合后,再分别与处理样品和对照样品的DNA文库第二混合,得到处理样品溶液和对照样品溶液,筛选所述处理样品溶液和对照样品溶液中与重组蛋白结合的DNA序列进行测序,分别得到处理样品和对照样品的测序结果;4)分别对所述处理样品和对照样品的测序结果进行预处理,分别得到处理样品和对照样品的待分析数据;所述预处理包括进行质控,过滤掉低质量的序列;5)将所述处理样品和对照样品的待分析数据分别与参考基因组进行比对,分别得到处理样品和对照样品的BAM文件;6)对处理样品和对照样品的BAM文件进行Peak

Calling分析,得到目标转录因子在全基因组范围内富集的位置信息;7)根据所述目标转录因子在全基因组范围内富集的位置信息,确定待分析序列,对所述待分析序列进行Homer

MotifsPeaks分析,筛选得到目标转录因子调控的基础序列;8)根据所述目标转录因子在全基因组范围内富集的位置信息,利用IGV对目标转录因子的结合峰进行可视化分析;9)对步骤7)得到的目标转录因子调控的基础序列进行全基因组基因的启动子比对,比对得...

【专利技术属性】
技术研发人员:张德强徐伟杰谢剑波
申请(专利权)人:北京林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1