【技术实现步骤摘要】
一种基于ATAC
‑
seq足迹识别转录因子共定位的方法
[0001]本方案属于计算机生物学
,提出了一种基于ATAC
‑
seq足迹识别转录因子共定位的方法。
技术介绍
[0002]转录因子(transcription factor,TF)是一类序列特异性DNA结合蛋白,能够结合在靶基因上游的转录因子结合位点序列,参与调控基因转录过程,从而保证目的基因以特定的强度在特定的时间与空间表达。一般来说,转录因子以组合的形式调控高等生物基因的表达,大多数的转录因子必须共同发挥作用才能完成转录任务。因此,在基因研究以及基因病研究中,获得显著的共定位转录因子对就显得很有必要。现有的转录因子共定位识别方法包括基于转录因子ChIP
‑
seq数据或者motif匹配的统计检验方法。
[0003]基于ChIP
‑
seq的方法,首先收集细胞系所有转录因子的ChIP
‑
seq实验数据,确定各转录因子在全基因组的结合位点,对两两转录因子结合位点的关系进 ...
【技术保护点】
【技术特征摘要】
1.一种基于ATAC
‑
seq足迹识别转录因子共定位的方法,其特征在于,该方法包括:S1.收集并下载待识别目标的ATAC
‑
seq数据,以获取原始的染色质开放性测序数据;S2.基于步骤S1获取的数据文件,使用足迹分析工具分析转录因子足迹在待识别目标基因组中的坐标数据;S3.利用转录因子数据库的转录因子motif与足迹坐标数据进行匹配,以获取每个结合位点的具体转录因子种类;所述的转录因子数据库收录有不同生物的转录因子与结合位点及结合方式;S4.通过距离计算工具计算每两种转录因子之间的距离ds;根据计算的ds,以第一距离阈值为准确定两种转录因子的共定位数k1;根据计算的ds,以第二距离阈值为准确定两种转录因子的共定位数k2;S5.基于泊松分布构建识别转录因子共定位模型;使用识别转录因子共定位模型分别计算k1、k2两种情况下的概率值P;根据概率值P和阈值P分别筛选两种情况下具有显著性的转录因子对;S6.对于第二距离阈值的情况,将k1大于期望值的显著性转录因子对判断为协同结合的转录因子对;对于第一距离阈值情况,将k2大于期望值的显著性转录因子对判断为竞争结合的转录因子对;根据竞争结合的转录因子对判断各协同结合的转录因子对是否同时属于竞争结合,若是,则将相应转录因子对判断为既竞争又协同。2.根据权利要求1所述的基于ATAC
‑
seq足迹识别转录因子共定位的方法,其特征在于,步骤S5中,显著性的转录因子对包括显著共定位的转录因子对和显著拒绝共定位的转录因子对。3.根据权利要求2所述的基于ATAC
‑
seq足迹识别转录因子共定位的方法,其特征在于,基于泊松分布构建识别转录因子共定位模型为:基于泊松分布构建识别转录因子共定位模型为:其中公式(1)中k为两转录因子在阈值范围内的共定位数,n,m分别为两种转录因子各自的定位数目,N代表待识别目标总共的结合位点,λ为期望值;通过公式(1)分别计算...
【专利技术属性】
技术研发人员:刘利,韩璐,邹权,丁漪杰,
申请(专利权)人:电子科技大学长三角研究院衢州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。