【技术实现步骤摘要】
三维基因组Hi-C数据中TAD嵌套结构检测方法及系统
本公开属于计算机数据处理
,尤其涉及三维基因组Hi-C数据中TAD嵌套结构检测方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。基因与人类生命健康密切关联,人类日常生理活动离不开基因的表达与调控,缺陷或病变基因能够影响相关疾病进程,若能够提早发现基因问题进行预防和控制,才可以有效控制疾病的发展。因此,基因一直是各国学者研究的重要课题。随着时代发展,研究技术不断进步,利用计算机对生物学领域,尤其是基因相关的庞大数据进行统计、模拟和管理的计算生物学给生物研究拓宽了全新的视野。通过数据分析,能够让原本不可见的基因遗传信息变得可被研究;通过模拟数据和建立模型,也能够让对基因的设想转变为可验证的假设,不断加深研究者对基因的认识。人类等真核生物的DNA不仅仅建立在一条线性链的基础上。DNA在细胞核内经过高度折叠和浓缩,使得染色质在空间上具有一定的复杂结构和构象。研究表明,这种结构和构象在基因表达和调控过程中起到了相当 ...
【技术保护点】
1.三维基因组Hi-C数据中TAD嵌套结构检测方法,其特征是,包括:/n针对获取的低分辨率Hi-C数据,进行双端测序并各自对比,根据对比结果进行合并并筛选有效配对后,用有效的配对构建接触矩阵;/n运用深度学习网络模型对低分辨率Hi-C数据进行增强;/n利用原始低分辨率Hi-C数据和增强后不同来源的Hi-C数据,检测TAD嵌套结构。/n
【技术特征摘要】
1.三维基因组Hi-C数据中TAD嵌套结构检测方法,其特征是,包括:
针对获取的低分辨率Hi-C数据,进行双端测序并各自对比,根据对比结果进行合并并筛选有效配对后,用有效的配对构建接触矩阵;
运用深度学习网络模型对低分辨率Hi-C数据进行增强;
利用原始低分辨率Hi-C数据和增强后不同来源的Hi-C数据,检测TAD嵌套结构。
2.如权利要求1所述的三维基因组Hi-C数据中TAD嵌套结构检测方法,其特征是,获取的低分辨率Hi-C数据首先进行统一规范化整理。
3.如权利要求1所述的三维基因组Hi-C数据中TAD嵌套结构检测方法,其特征是,所述深度学习网络模型包括:输入层、隐藏层及输出层;
所述输入层主要用于从输入中提取低分辨率Hi-C接触矩阵的特征和模式,以获得低分辨率样本与训练阶段高分辨率样本之间的关系,并预测生产阶段低分辨率样本的高分辨率样本,同时使用内部卷积来增加网络的非线性;
隐藏层附加的主要作用是裁剪输入Hi-C接触矩阵的大小,隐藏层中包括小卷积内核,满足裁剪矩阵需要;
输出层作通过使用从上一个网络中提取的功能来增强Hi-C数据的分辨率,并输出高分辨率Hi-C接触矩阵。
4.如权利要求1所述的三维基因组Hi-C数据中TAD嵌套结构检测方法,其特征是,所述高分辨率子矩阵合并到染色体大小Hi-C相互作用矩阵中。
5.如权利要求1所述的三维基因组Hi-...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。