纳米孔测序数据分析方法、装置以及存储介质和应用制造方法及图纸

技术编号:36407031 阅读:64 留言:0更新日期:2023-01-18 10:15
本发明专利技术公开纳米孔测序数据分析方法、装置以及存储介质和应用。本发明专利技术能够通过一次检测获得多维度生物信息,利用纳米孔测序的长读长以及“直读”修饰位点的特点能够对生物样本进行有效地区分,进而为后续临床报告解读及用药指导提供依据。相对于二代测序的甲基化检测及组织溯源的解决方案,本发明专利技术大大简化了实验操作步骤,大幅度降低了实验的复杂度、测序数据量及测序成本,带来了更大的经济效益,同时也降低了数据分析的难度,缩短了检测周期,更适应实际的临床检测需求。应实际的临床检测需求。应实际的临床检测需求。

【技术实现步骤摘要】
纳米孔测序数据分析方法、装置以及存储介质和应用


[0001]本专利技术涉及生物信息领域,具体地涉及纳米孔测序数据分析方法、装置以及存储介质和获取生物样本中基因信息并对生物样本进行分类的方法。

技术介绍

[0002]DNA甲基化(DNA methylation)为DNA化学修饰的一种形式,是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5号碳位共价键结合一个甲基基团。大量研究表明,DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。因此,DNA甲基化越来越受到重视。
[0003]近年来,基于二代测序技术(NGS)结合血液中细胞游离DNA(cell free DNA,cfDNA)及循环肿瘤DNA(circular tumor DNA, ctDNA)的液体活检检测技术的飞速发展提供了通过血液样本了解器官和组织的机遇,通过cfDNA的核小体的降解规律、器官特异的甲基化位点等信息,以及通过相邻甲基化位点之间的关联,来达到cfDNA的组织和器官的溯源。该类研究使得通过检测cfDNA/ctDNA的甲基化可以准确的对身体不同部位的疾病状况进行检测提供了潜力,临床的应用提供了基础。目前,甲基化在肿瘤诊断及治疗领域的研究还在快速的发展。
[0004]纳米孔测序技术(nanopore sequencing technology,NST),又称第四代测序技术或单分子实时DNA测序技术,是一种在DNA测序时,不需要经过PCR扩增即可实现对每一条DNA分子单独测序的技术。相较于NGS测序技术可以测到上百个碱基的短读长,纳米孔测序技术的测序读长可以达到几千至几万个碱基,甚至可以达到几兆碱基级别的超长读长,这有助于分析cfDNA/ctDNA的原始片段的特征及长度分布;同时又可以“直读”测序序列的修饰信息,即单链DNA通过纳米孔时系统会记录下离子电流的变化,而甲基化和非甲基化的DNA通过纳米孔的时候电流不同,从而可以测得不同位点DNA的甲基化水平。
[0005]目前,针对液体活检样本(例如cfDNA)的DNA甲基化的常用检测技术之一是通过二代高通量测序获得全基因组上各位点的甲基化水平,在实验上对DNA的处理主要有用重亚硫酸氢盐转化、甲基化抗体或MBD(Methyl

CpG

Binding Domain)亲和的富集以及结合限制性内切酶进行酶切和亚硫酸氢盐(RRBS)的三种方法。虽然有一些对靶向甲基化位点进行设计的panel降低了数据量及测序成本,但实验过程并没有进行优化处理,操作依然复杂,并且例如亚硫酸氢盐的处理方式对DNA也会造成不同程度的降解从而造成部分甲基化信息的丢失以及模糊了DNA片段化的特征。而针对DNA片段特征及长度分布的分析更是触及了NGS测序读长短的痛点,不能进行完整分析的同时还要通过全基因组的高深度测序得到大量的测序数据及复杂的分析才可以完成。特别地,由于实验原理的不同,导致针对液体活检样本的DNA甲基化检测、DNA片段特征及长度分布的分析以及癌症靶向热点检测的服务产品都是各自独立进行的,即无法做到在一次检测中同时得到上述多维度的信息,不仅增加了DNA的起始量消耗以及实验的难度和复杂度,而且也大大增加了测序及数据分析的成本。
[0006]
技术介绍
中的信息仅仅在于说明本专利技术的总体背景,不应视为承认或以任何形式
暗示这些信息构成本领域一般技术人员所公知的现有技术。

技术实现思路

[0007]为解决现有技术中的至少部分技术问题,本专利技术提供纳米孔测序数据分析方法、装置以及存储介质和应用。本专利技术利用纳米孔测序技术在实验及数据分析上均较好地解决了上述现有技术中的至少部分问题。具体地,本专利技术包括以下内容。
[0008]本专利技术的第一方面,提供一种纳米孔测序数据分析方法,其包括:获取纳米孔测序的电流信号数据,所述电流信号数据至少包括时序电流信号Ion

A,其包括横向的时间维度和纵向的信号强度维度至少两个维度的信息;对Ion

A进行碱基识别分析,得到测序数据Data

A,基于所述Data

A分析片段特征;基于Ion

A进行靶向位点甲基化检测,获取所述靶向位点的甲基化信息;和根据所述片段特征和所述甲基化信息对生物样本进行分类。
[0009]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,其中,所述片段特征包括长度分布特征、motif特征和组织特征中的至少之一。
[0010]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述长度分布特征的分析包括对测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,进行筛选后读长序列的长度统计并作长度分布图,得到长度分布特征。
[0011]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述motif特征的分析包括对测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,统计每条读长序列前k

mer的motif的频次或相对丰度,其中4<=k<=10,得到motif特征。
[0012]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述组织特征的分析包括对测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,筛选出规定长度范围的序列片段与细胞系及原发组织的参考样本的表达谱数据进行比较分析、计算相关性,从而进行组织溯源的分析,得到组织特征。
[0013]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述甲基化检测包括在时间方向上以规定步长滑动切割所述Ion

A,得到由不同电流信号片段组成的集合DST,将集合DST中的各电流信号片段分别与参考信号片段集DSR进行相似性比对分析,其中,所述参考信号片段集DSR包括甲基化信号片段子集和非甲基化信号片段子集。
[0014]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述甲基化检测进一步包括根据比对的相似性进行甲基化判别,其包括若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数>1,则将靶向位点解读为甲基化,若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数<1,则将靶向位点解读为非甲基化。
[0015]在某些实施方案中,根据第一方面所述的纳米孔测序数据分析方法,所述参考信号片段集DSR的构建包括合成含有甲基化靶向位点的第一序列片段和对应的含有非甲基化
靶向位点的第二序列片段,经纳米孔测序得到对应于所述第一序列片段的第一参考信号片段和对应于第二序列片段的第二参考信号片段,由多个所述第一参考信号片段组成甲基化信号片本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种纳米孔测序数据分析方法,其特征在于,包括:获取生物样本由纳米孔测序得到的电流信号数据,所述电流信号数据至少包括时序电流信号Ion

A,其包括横向的时间维度和纵向的信号强度维度至少两个维度的信息;对所述Ion

A进行碱基识别分析,得到测序数据Data

A,基于所述Data

A分析片段特征;基于所述Ion

A进行靶向位点甲基化检测,获取所述靶向位点的甲基化信息;和根据所述片段特征和所述甲基化信息对所述生物样本进行分类。2.根据权利要求1所述的纳米孔测序数据分析方法,其特征在于,所述片段特征包括长度分布特征、motif特征和组织特征中的至少之一。3.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述长度分布特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,进行筛选后读长序列的长度统计并作长度分布图,得到长度分布特征。4.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述motif特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,统计每条读长序列前k

mer的motif的频次或相对丰度,其中4<=k<=10,得到motif特征。5.根据权利要求2所述的纳米孔测序数据分析方法,其特征在于,所述组织特征的分析包括对所述测序数据中的序列进行筛选以保留在人类参考基因组中具有唯一比对且非软切的测序读长序列结果,筛选出规定长度范围的序列片段与细胞系及原发组织的参考样本的表达谱数据进行比较分析、计算相关性,从而进行组织溯源的分析,得到组织特征。6.根据权利要求1所述的纳米孔测序数据分析方法,其特征在于,所述甲基化检测包括在时间方向上以规定步长滑动切割所述Ion

A,得到由不同电流信号片段组成的集合DST,将集合DST中的各电流信号片段分别与参考信号片段集DSR进行相似性比对分析,其中,所述参考信号片段集DSR包括甲基化信号片段子集和非甲基化信号片段子集。7.根据权利要求6所述的纳米孔测序数据分析方法,其特征在于,所述甲基化检测进一步包括根据比对的相似性进行甲基化判别,其包括若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数>1,则将靶向位点解读为甲基化,若集合DST中各电流信号片段与甲基化信号片段子集比对一致的结果数/与非甲基化信号片段子集比对一致的结果数<1,则将靶向位点解读为非甲基化。8.根据权利要求7所述的纳米孔测序数据分析方法,其特征在于,所述参考信号片段集DSR的构建包括合成含有甲基化靶向位点的第一序列片段和含有非甲基化靶向位点的第二序列片段,经纳米孔测序得到对应于所述第一序列...

【专利技术属性】
技术研发人员:郎继东
申请(专利权)人:北京齐碳科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1