System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于DAP-seq和转录组测序数据构建基因调控网络的方法技术_技高网
当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于DAP-seq和转录组测序数据构建基因调控网络的方法技术

技术编号:40982705 阅读:3 留言:0更新日期:2024-04-18 21:28
本发明专利技术公开了一种基于DAP‑seq和转录组测序数据构建基因调控网络的方法,所述方法通过分析转录因子结合位点和基因表达水平构建一个反映转录因子和其靶基因之间相互作用的综合网络,进而揭示基因调控机制。本发明专利技术的方法通过综合考虑转录因子的DNA结合特性和基因表达模式,能够更准确地构建基因调控网络。该方法不仅提高了调控关系预测的准确性,还能够揭示转录因子和基因之间的直接调控关系,为深入理解细胞功能和疾病机制提供了新的工具。

【技术实现步骤摘要】

本专利技术属于生物信息学和基因组学,尤其涉及一种基于dap-seq和转录组测序数据构建基因调控网络的方法。


技术介绍

1、在分子生物学和系统生物学中,了解基因表达的调控机制对于揭示细胞功能和疾病发生的基础是至关重要的。基因调控网络(grns)是描述基因产品之间相互作用的数学模型,它们对于理解生物系统的复杂性至关重要。传统的基因调控网络构建方法依赖于基因表达数据,如微阵列或rna测序(rna-seq),但这些方法通常无法提供关于转录因子与特定dna序列相互作用的直接证据。

2、dna亲和素纯化测序(dap-seq)是一种新兴的技术,它能够识别转录因子与dna的直接相互作用位点。dap-seq通过使用转录因子融合到亲和素标签,然后与整个基因组的dna结合,随后通过高通量测序来识别转录因子的结合位点。然而,dap-seq数据本身并不能揭示转录因子结合如何影响下游基因表达。

3、另一方面,时序转录组高通量测序技术(如rna-seq)能够提供细胞在特定条件下全面的基因表达谱,但它不能确定调控这些表达模式的特定转录因子。因此,单独使用dap-seq或rna-seq数据都不能完全揭示转录因子和目标基因之间的动态调控关系。

4、现有技术的限制在于,没有一种方法能够整合dap-seq和rna-seq数据来构建基因调控网络,同时考虑转录因子的dna结合特性和基因表达模式。此外,现有方法往往缺乏对调控网络中关键转录因子和基因功能角色的深入理解,这限制了它们在复杂疾病模型和生物系统中的应用。

5、因此,有必要开发一种新的方法,能够整合dap-seq和rna-seq数据,以构建更为精确和功能性的基因调控网络。这样的方法将有助于更好地理解转录调控复杂性,并为疾病治疗和生物技术应用提供新的视角。


技术实现思路

1、专利技术目的:为了解决上述技术问题,本专利技术提供一种基于dap-seq和转录组测序数据构建基因调控网络的方法,该方法能够整合转录因子的dna结合信息与基因表达数据,以构建出反映真实细胞状态的基因调控网络。

2、技术方案:为了实现上述目的,本专利技术所述一种基于dap-seq和转录组测序数据构建基因调控网络的方法,包括如下步骤:

3、(1)获取特定细胞类型或组织样本的转录组测序数据和dap-seq数据;

4、(2)从dap-seq数据中,识别转录因子的结合位点和相应的结合强度,预测靶基因;

5、(3)从转录组测序数据中得到基因共表达模块;

6、(4)关联转录因子的结合位点与其可能调控的基因,构建初步的转录因子-基因调控对;

7、(5)结合基因表达水平和转录因子结合强度,通过统计分析方法筛选出显著的转录因子-基因调控对;

8、(6)构建基因调控网络,该网络由筛选出的显著转录因子-基因调控对形成;

9、(7)应用网络分析工具,识别在调控网络中具有中心作用的关键转录因子和基因;

10、(8)进行功能富集分析,探究关键转录因子和基因在生物过程中的作用。

11、进一步地,所述步骤(1)中的转录组测序数据和dap-seq数据通过公共数据库获取或通过实验室自行测序获得。

12、进一步地,所述步骤(2)中利用macs3软件,鉴定发现3212个dna结合位点,并计算每个位点的结合强度。

13、进一步地,所述步骤(3)中利用wgcna软件构建低氮处理下,基因共表达网络。

14、进一步地,通过基因共表达网络鉴定发现特异共表达模块blue包含1231genes。

15、进一步地,所述步骤(4)中的转录因子-基因调控对的构建,所述转录因子结合位点与基因启动子区域的空间邻近性。

16、进一步地,所述步骤(5)中的统计分析方法为皮尔森相关系数、偏相关分析或机器学习算法中的任意一种。

17、进一步地,所述步骤(7)中的网络分析工具为网络中心性分析、模块分析或网络拓扑结构分析中的任意一种。

18、进一步地,所述步骤(8)中的功能富集分析使用go(gene ontology)富集分析、kegg(kyoto encyclopedia of genes and genomes)通路分析、或其他生物信息学工具中的任意一种。

19、作为优选,本专利技术提供了一种基于dap-seq和转录组测序数据构建基因调控网络的方法,包括以下步骤:

20、(1)从实验中或者公共ncbi数据库中获取特定细胞类型或组织样本的dap-seq数据和时序转录组高通量测序数据;

21、(2)利用dap-seq数据,利用fastp软件清理序列质量,然后通过bwa软件比对到参考基因组,筛选保留特异性比对,进一步利用macs3软件识别转录因子的dna结合位点及其结合强度;

22、(3)利用转录组测序数据,利用fastp软件清理序列质量,然后利用star软件讲序列比对到参考基因组,进一步利用wgcna软件构建基因间的共表达网络,确定基因在特定条件下的特异共表达模块;

23、(4)将转录因子的结合位点位置与基因组编码基因相关联,构建转录因子与目标基因之间的初步调控关系;

24、(5)结合dapseq鉴定的转录因子下游靶基因和特异基因共表达模块,筛选出具有显著调控关系的转录因子-基因对;

25、(6)基于筛选出的转录因子-基因对,构建基因调控网络,并利用网络分析工具cytoscape识别关键的调控元件和潜在的调控枢纽基因(dapseq数据中结合在上游2kb的启动子区域,共表达网络模块中membership值>0.9);

26、(7)对特定条件下靶向调控的基因进行功能富集分析,以揭示关键转录因子和基因在细胞生理和病理过程中的作用。

27、有益效果:与现有技术相比,本专利技术具备如下显著效果:

28、本专利技术的方法通过综合考虑转录因子的dna结合特性和基因表达模式,能够更准确地构建基因调控网络。该方法不仅提高了调控关系预测的准确性,还能够揭示转录因子和基因之间的直接调控关系,为深入理解细胞功能和疾病机制提供了新的工具。

29、此外,本专利技术的方法通过网络分析揭示了调控网络中的关键节点,这些节点可能是疾病发生的关键因素或潜在的治疗靶点。功能富集分析进一步提供了这些关键节点在生物过程中的作用,为疾病的诊断和治疗提供了理论基础。

30、本专利技术的方法适用于不同类型的细胞和组织,具有广泛的应用前景,包括但不限于癌症生物学、发育生物学、植物生物学以及疾病模型研究。

本文档来自技高网...

【技术保护点】

1.一种基于DAP-seq和转录组测序数据构建基因调控网络的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中的转录组测序数据和DAP-seq数据通过公共数据库获取或通过实验室自行测序获得。

3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中利用MACS3软件鉴定发现3212个DNA结合位点,并计算每个位点的结合强度。

4.根据权利要求1所述的方法,其特征在于,所述步骤(3)中利用WGCNA软件构建低氮处理下基因共表达网络。

5.根据权利要求4所述的方法,其特征在于,通过基因共表达网络鉴定发现特异共表达模块Blue包含1231genes。

6.根据权利要求1所述的方法,其特征在于,所述步骤(4)中的转录因子-基因调控对的构建为转录因子结合位点与基因启动子区域的空间邻近性。

7.根据权利要求1所述的方法,其特征在于,所述步骤(5)中的统计分析方法为皮尔森相关系数、偏相关分析或机器学习算法中的任意一种。

8.根据权利要求1所述的方法,其特征在于,所述步骤(7)中的网络分析工具为网络中心性分析、模块分析或网络拓扑结构分析中的任意一种。

9.权利要求1所述的方法,其特征在于,所述步骤(8)中的功能富集分析使用GO(GeneOntology)富集分析、KEGG(Kyoto Encyclopedia of Genes and Genomes)通路分析或其他生物信息学工具中的任意一种。

...

【技术特征摘要】

1.一种基于dap-seq和转录组测序数据构建基因调控网络的方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中的转录组测序数据和dap-seq数据通过公共数据库获取或通过实验室自行测序获得。

3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中利用macs3软件鉴定发现3212个dna结合位点,并计算每个位点的结合强度。

4.根据权利要求1所述的方法,其特征在于,所述步骤(3)中利用wgcna软件构建低氮处理下基因共表达网络。

5.根据权利要求4所述的方法,其特征在于,通过基因共表达网络鉴定发现特异共表达模块blue包含1231genes。

6.根据权利...

【专利技术属性】
技术研发人员:罗楚平庞兵文吕远大成骏杰
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1