【技术实现步骤摘要】
用于计算微生物基因组甲基化单碱基分辨率动力学的系统
[0001]本专利技术涉及基因工程
,特别涉及用于计算微生物基因组甲基化单碱基分辨率动力学的系统。
技术介绍
[0002]肺炎克雷伯菌(K.pneumoniae)是肠杆菌科的重要成员,可引起严重的医院和社区获得性感染,如肺炎、泌尿生殖道感染和败血症。肺炎克雷伯菌菌株有多种分型方法,包括血清分型、多位点序列分型(MLST)和CG分型。研究表明,高毒力表型通常对应于K1/K2/K57血清型和CG23
‑
ST23,而多药耐药(MDR)表型通常对应于CG258
‑
ST11/ST258。
[0003]使用分子生物学技术对肺炎克雷伯菌菌株DNA甲基化的研究确定了三种DNA甲基化酶(MTase)和相应的基序,包括两种限制性修饰(RM)系统(M.KpnI:GGTACC;M.KpnBI:CAAAN6RTCA)和一种孤儿MTase(Dam:GATC)。对Dam的进一步研究揭示了参与调节肺炎克雷伯菌菌株错配修复、毒力和致病性的表观遗传机制。 />[0004]高通本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,包括:数据采集模块,其用于获取来源于不同生长周期内的微生物的基因组测序数据,其中所述测序数据至少包括测序深度数据;数据拟合模块,所述数据拟合模块用于构建与第一复制叉距离不等的基因组位点的复制数矩阵,并计算第一复制叉所处基因组位置的累积分布密度,对所述测序深度数据进行拟合,从而得到基因组复制时间;甲基化基序的再修饰时间确定模块,其通过构建计算模型,得到每个基序位点的甲基化时间,其中根据初始甲基化水平支持甲基化C的测序读段/总测序读段、甲基化基序的修饰水平、基因组复制起始点再启动的间隔时间、基因组复制时间、第一复制叉的分布密度构建所述计算模型。2.根据权利要求1所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,所述生长周期包括生长对数期、静止过渡期和静止期。3.根据权利要求1所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,所述数据拟合模块进一步包括构建拟合模型的步骤。4.根据权利要求3所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,所述拟合模型如下所示:5.根据权利要求4所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,所以测序深度数据分布以倍增点(s
DP
)为中心将数据分为左(s≤s
DP
)、右(s≥s
DP
)两侧,分别构建数学模型对数据进行拟合,其中每个碱基在基因组上的相对位置(x):S
G
为一半基因组的长度,而复制起始点再启动时,第一复制叉走过的距离(Δx
R
):Δx
R
=t
D
/t
R (0≤t
D
≤t
R
)
ꢀꢀ
(2);t
R
为完成基因组复制所需时间,通过构建与第一复制叉(s1)距离不等的基因组位点(s)的复制拷贝数矩阵,基因组位点x的DNA拷贝数(f
(x)
)为:即当复制位点x位于第一复制叉前(x≥x1)时,该位点的拷贝数1;当复制位点x位于第一复制叉和第二复制叉之间(x1‑
Δx
R
≤x≤x1)时,该位点的拷贝数2,以此类推;为了对测序深度数据进行拟合,利用B分布评估第一复制叉位于不同位置(x1∈[0,1])的细胞群体分布密度,由于碱基在基因组上的相对位置(x)并非连续数据(步长为1/S
G
),所以可以用相邻碱基的累积B分布密度(I
x
(α,β))差代表不同位置的第一复制叉(x1)的分布密度度由于在排除测序误差的情况下,基因组不同区段的测序深度曲线是第一复制叉位于不
同位置的细胞所提供的基因组拷贝数贡献的积分,所以:6.根据权利要求1所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,由于对M
(x)
的影响规律不同,将j<n和n≤j≤N两种情况分别进行所述计算模型的构建,其中,所述计算模型如下所示:7.根据权利要求1所述的用于计算微生物基因组甲基化单碱基分辨率动力学的系统,其特征在于,第一复制叉发生的相对平均位移(Δx
M
)对应基序平均甲基化时间(...
【专利技术属性】
技术研发人员:张聚,丁楠,
申请(专利权)人:首都医科大学附属北京地坛医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。