【技术实现步骤摘要】
【国外来华专利技术】生成增强Hi
‑
C矩阵的方法、识别增强Hi
‑
C矩阵中结构染色质像差的方法及可读介质
[0001]本申请的实施例涉及用于生成增强的Hi
‑
C矩阵的方法、存储用于生成增强的Hi
‑
C矩阵的程序的非瞬态计算机可读介质、用于识别增强的Hi
‑
C矩阵中的结构染色质像差的方法,以及用于诊断和治疗诸如癌症等医学病症或疾病的方法。
技术介绍
[0002]高通量染色体构象捕获(High
‑
throughput chromosome conformation capture,Hi
‑
C)允许在空间中对染色质相互作用进行全基因组分析,并已被用于研究基因组的全基因组相互作用。众所周知,染色质的空间组织是非随机的,对于解读DNA的三维结构如何影响基因组功能和转录至关重要。通过全面检测基因组区域之间的空间相互作用,Hi
‑
C技术对染色质的三维组织提供了更深入的见解。Hi
‑
C技术通常涉及生成数亿的配对末端测序。该技术可以捕获整个基因组中的染色质相互作用,并构建全基因组的Hi
‑
C接触矩阵(Hi
‑
C contact matrix),其中矩阵中的每个元素表示任意两个基因组区域之间的接触强度。
[0003]如Lieberman
‑
Aiden等人的美国申请US2017/0362649中所讨论的,“接触”是在读段后仍保留的片段对, ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于生成增强的Hi
‑
C矩阵的方法,所述方法包括:对输入的Hi
‑
C矩阵进行去噪,获得平衡距离矩阵;对所述平衡距离矩阵进行去噪,获得去噪后的距离矩阵;对所述去噪后的距离矩阵进行整理和排序,获得排序后的距离矩阵;基于所述排序后的矩阵,计算邻接矩阵;以及计算所述邻接矩阵的Laplacian特征映射,获得增强的Hi
‑
C矩阵。2.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,所述输入的Hi
‑
C矩阵为原始数据Hi
‑
C矩阵。3.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,所述输入的Hi
‑
C矩阵是由SCN、HiCNorm、ICE、KR、chromoR和multiHiCcompare中的至少一种生成的归一化的Hi
‑
C矩阵。4.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,对所述Hi
‑
C矩阵进行去噪,获得平衡距离矩阵的步骤,包括采用扩散状态距离算法。5.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,对所述Hi
‑
C矩阵进行去噪,获得平衡距离矩阵的步骤包括:通过将所述矩阵的每一行除以相应的行的和,来归一化所述Hi
‑
C矩阵,获得归一化矩阵,其中所述矩阵的每一行的总和等于1;迭代计算归一化矩阵的倍数幂,获得收敛矩阵;根据公式(I)计算矩阵M:M=(I
‑
P+D)
‑1ꢀꢀꢀ
(I)其中,I为单位矩阵,P为所述归一化矩阵,D为所述收敛矩阵;以及将所述矩阵M的每一行作为坐标向量,计算每一行的成对距离,获得平衡距离矩阵。6.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,对所述平衡距离矩阵进行去噪,获得去噪后的距离矩阵的步骤,包括对所述平衡距离矩阵进行特征向量分解。7.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,对所述去噪后的距离矩阵进行整理和排序,获得排序后的距离矩阵包括:将所述去噪后的距离矩阵的每一行从最小到最大排序,并将每个元素替换为其序号,得到排序后的距离矩阵;以及根据公式(II)对所述排序后的距离矩阵进行对称化,获得排序后的矩阵Rank:Rank=(R+R
T
)/2
ꢀꢀꢀꢀ
(II)其中,R为所述排序后的距离矩阵,R
T
为R的转置。8.根据权利要求1所述的用于生成增强的Hi
‑
C矩阵的方法,其中,所述邻接矩阵根据公式(III)计算:Adj=e
‑
Rank/σ
ꢀꢀꢀꢀ
(III)其中,σ为正数。9.根据权利要求1所述的用于生成增强的Hi
‑...
【专利技术属性】
技术研发人员:何玥颖,薛玥,王静瑶,高毅勤,
申请(专利权)人:染色质北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。