【技术实现步骤摘要】
纳米孔测序数据分析方法、装置以及存储介质和应用
[0001]本专利技术涉及生物信息领域,具体地涉及纳米孔测序数据分析方法、装置以及存储介质和获取生物样本中基因信息并对生物样本进行分类的方法。
技术介绍
[0002]DNA甲基化(DNA methylation)为DNA化学修饰的一种形式,是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5号碳位共价键结合一个甲基基团。大量研究表明,DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。因此,DNA甲基化越来越受到重视。
[0003]近年来,基于二代测序技术(NGS)结合血液中细胞游离DNA(cell free DNA,cfDNA)及循环肿瘤DNA(circular tumor DNA, ctDNA)的液体活检检测技术的飞速发展提供了通过血液样本了解器官和组织的机遇,通过cfDNA的核小体的降解规律、器官特异的甲基化位点等信息,以及通过相邻甲基化位点之间的关联,来达到cfDNA的组织和器官的溯源。该类研究使得通过检测cfDNA/ctDNA的甲基化可以准确的对身体不同部位的疾病状况进行检测提供了潜力,临床的应用提供了基础。目前,甲基化在肿瘤诊断及治疗领域的研究还在快速的发展。
[0004]纳米孔测序技术(nanopore sequencing technology,NST),又称第四代测序技术或单分子实时DNA测序技术,是一种在DNA测序时,不需要经过PCR扩增即可实现对每一条DNA分子单 ...
【技术保护点】
【技术特征摘要】
1.一种纳米孔测序数据分析方法,其特征在于,包括:获取生物样本由纳米孔测序得到的电流信号数据,所述电流信号数据至少包括时序电流信号Ion
‑
A,其包括横向的时间维度和纵向的信号强度维度至少两个维度的信息;对所述Ion
‑
A进行碱基识别分析,得到测序数据Data
‑
A,基于所述Data
‑
A分析片段特征;基于所述Ion
‑
A进行靶向位点甲基化检测,获取所述靶向位点的甲基化信息;和根据所述片段特征和所述甲基化信息对所述生物样本进行分类。2.根据权利要求1所述的纳米孔测序数据分析方法,其特征在于,所述片段特征包括长度分布特征、motif特征和组织特征中的至少之一。3.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述长度分布特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,进行筛选后读长序列的长度统计并作长度分布图,得到长度分布特征。4.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述motif特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,统计每条读长序列前k
‑
mer的motif的频次或相对丰度,其中4<=k<=10,得到motif特征。5.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述组织特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,筛选出规定长度范围的序列片段与细胞系及原发组织的参考样本的表达谱数据进行比较分析、计算相关性,从而进行组织溯源的分析,得到组织特征。6.根据权利要求1所述的纳米孔测序数据分析方法,其特征在于,所述甲基化检测包括在时间方向上以规定步长滑动切割所述Ion
‑
A,得到由不同电流信号片段组成的集合DST,将集合DST中的各电流信号片段分别与参考信号片段集DSR进行相似性比对分析,其中,所述参考信号片段集DSR包括甲基化信号片段子集和非甲基化信号片段子集。7.根据权利要求6所述的纳米孔测序数据分析方法,其特征在于,所述甲基化检测进一步包括根据比对的相似性进行甲基化判别,其包括若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数>1,则将靶向位点解读为甲基化,若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数<1,则将靶向位点解读为非甲基化。8.根据权利要求7所述的纳米孔测序数据分析方法,其特征在于,所述参考信号片段集DSR的构建包括合成含有甲基化靶向位点的第一序列片段和含有非甲基化靶向位点的第二序列片段,经纳米孔测序得到对应于所述第一序列...
【专利技术属性】
技术研发人员:郎继东,
申请(专利权)人:北京齐碳科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。