【技术实现步骤摘要】
Hi-C数据分辨率增强方法、系统、电子设备及存储介质
本专利技术涉及分子生物学
,具体的,涉及一种Hi-C数据分辨率增强方法和系统以及电子设备和计算机可读存储介质。
技术介绍
随着人类基因组百科全书计划的大力发展,一维线性的基因组已经被研究地越来越清晰。然而,想要深层次了解基因调控原理必须要获取调控元件在细胞核中的三维空间关系,三维基因组的研究由此得到了迅速的发展。研究三维基因组的一种代表技术即为高通量染色体构象捕获技术(Hi-C),它可以大规模地应用在全基因组无偏相互作用的检测中,从而方便让研究者们来探究DNA分子是如何通过层层折叠在细胞核中并且保证基因的精确调控。高通量染色体构象捕获技术(Hi-C)是以快速发展的高通量测序技术为基础,其分辨率特指能检测出相互作用的基因组片段最小的长度。分辨率越高,人们对基因组的三维结构认知会将会更加清晰。目前常见的Hi-C数据分辨率在二十五千碱基对到一百万碱基对不等,但是获取高分辨率的Hi-C数据需要更深的测序深度以及较多的经济成本。
技术实现思路
本专 ...
【技术保护点】
1.一种Hi-C数据分辨率增强方法,其特征在于,所述增强方法包括:/n取高分辨率Hi-C数据和分辨率待增强的原始Hi-C数据;/n以所述高分辨率Hi-C数据为样本进行训练,计算出所述高分辨率Hi-C数据与低分辨率Hi-C数据之间的映射关系;/n依据所述映射关系计算出所述分辨率待增强的原始Hi-C数据所对应的分辨率增强后的Hi-C数据。/n
【技术特征摘要】
1.一种Hi-C数据分辨率增强方法,其特征在于,所述增强方法包括:
取高分辨率Hi-C数据和分辨率待增强的原始Hi-C数据;
以所述高分辨率Hi-C数据为样本进行训练,计算出所述高分辨率Hi-C数据与低分辨率Hi-C数据之间的映射关系;
依据所述映射关系计算出所述分辨率待增强的原始Hi-C数据所对应的分辨率增强后的Hi-C数据。
2.如权利要求1所述的Hi-C数据分辨率增强方法,其特征在于,所述训练的具体过程为:
将所述高分辨率Hi-C数据进行降采样生成低分辨率Hi-C数据;
将所述高分辨率Hi-C数据转换成为矩阵,记为第一矩阵;将所述低分辨率Hi-C数据转换成为矩阵,记为第二矩阵;
所述第二矩阵经由卷积层的计算生成第三矩阵;
计算第一矩阵和第三矩阵的均方误差,当所述均方误差的值不再减小时,停止训练,并保存所述卷积层的计算方法,所述计算方法即为所述高分辨率Hi-C数据与低分辨率Hi-C数据之间的映射关系,否则更新所述卷积层的参数继续计算生成新的第三矩阵,直至所述均方误差的值不再减小。
3.如权利要求2所述的Hi-C数据分辨率增强方法,其特征在于,所述第二矩阵经由卷积层的计算生成第三矩阵的计算公式为:
所述公式中X为所述第二矩阵,Gθ(X)为所述生成器模块所生成的第三矩阵,Convw(X)代表卷积核参数为w的卷积操作。
4.如权利要求2所述的Hi-C数据分辨率增强方法,其特征在于,所述第二矩阵在经由所述卷积层进行计算之前被拆分成若干个子矩阵,之后所述子矩阵分别经由所述卷积层进行计算,最后将计算结果参照所述拆分方式进行合并生成所述第三矩阵。
5.如权利要求2所述的Hi-C数据分辨率增强方法,其特征在于,将所述高分辨率Hi-C数据进行降采样生成低分辨率Hi-C数据过程中的降采样为随机降采样。
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。