【技术实现步骤摘要】
本专利技术涉及一种预测真核基因组核小体(nucleosome)的方法,该预测方法通过匹配核小体DNA的弯曲度模版实现预测。
技术介绍
真核生物DNA以染色质形式存在,其基本单元为核小体;核小体系由 147bp的DNA缠绕在组蛋白八联体(2倍的组蛋白H2A、H2B、H3和H4)上形成的结构,核小体之间以连接DNA相连。核小体定位是指DNA双螺旋相对于组蛋白核的位置,核小体DNA的蛋白结合位点被封闭,因此无法结合蛋白(转录因子)。核小体定位通过遮蔽或者暴露蛋白结合位点调节真核基因的复制、转录等基础生物学过程。因此,预测核小体对于分析基因的转录调节等至关重要,预测核小体就是预测基因组DNA哪些区域是缠绕在组蛋白核上的核小体DNA(nucleosome DNA),哪些是处于连接区域的连接DNA(linker DNA)。利用湿实验手段直接检测核小体仍然需要一定的成本。近年来,研究发现核小体的位置部分地与DNA序列有关,即可以通过基因组DNA序列实现核小体的预测。目前,国际上有一种通过概率模型预测核小体的方法,这种方法首先需要计算四种核苷酸在核小体DNA序列的每个位置出现的频率,形成位点频率矩阵,然后计算待预测序列在该位点频率矩阵上的得分,实现核小体预测。这种方法的缺点在于1,建立位点频率矩阵,首先需要知道一定数目的核小体DNA序列;2,对不同物种基因组核小体预测,需要建立不同的位点频率矩阵;3,计算方法较复杂,对于大规模的基因组预测,速度显得较慢。这些缺陷限制了这种方法的进一步应用。
技术实现思路
本专利技术提供一种能够实现快速准确预测的基于核小体脱氧核糖核酸模版的核 ...
【技术保护点】
一种基于核小体脱氧核糖核酸模版的核小体预测方法,其特征在于,包括以下步骤:步骤1?获取待预测的DNA序列,长度为T,并利用计算待预测的DNA序列弯曲度信号Signal,其中,C的模代表弯曲度,=10.4?bp,是DNA双螺旋一个周期的碱基对平均数目,n1和n2代表加和范围的起始和终止位置,i为复数单位,ρ和τ是16种二联核苷酸在空间弯曲的幅度,ρ为在平面旋转的幅度,τ为扭曲的幅度,步骤2?建立核小体DNA模版信号P,所述的模板信号为一条147(bp)长的数字信号,该模板信号两端区域宽度为50bp,高度为0.07,中间区域的宽度为47bp,高度为0.05,卷积弯曲度信号和模板信号得到卷积信号Signal:给定模板信号P和弯曲度信号Signal,长度分别为147和T?10,二者的卷积为????其中,S_covn为卷积的结果,长度为147+T?10?1,从卷积结果S_covn中部取出长度为T?10的信号,标记为S_covn_keep,长度为T?10,k是一个变量,,,步骤?3?检测卷积信号S_covn_keep的峰位置,具体过程为:步骤3.1?计算S_covn_keep的连续小波变换,小波母 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。