一种脱落细胞DNA低频突变富集测序方法技术

技术编号:12471116 阅读:283 留言:0更新日期:2015-12-09 20:11
本发明专利技术提供了一种脱落细胞DNA的低频突变富集测序方法,包括脱落细胞DNA的提取与DNA的打断,样品DNA文库构建、通用文库TT-COLD PCR扩增富集、探针富集捕获、捕获产物PCR及上机测序、正反双链纠错低频信息分析步骤,具体为基于接头通用引物进行TT COLD PCR对所有类型变异实现第一级突变富集扩增;设计富集探针芯片,针对热点变异将人基因组参考序列hg19设计的探针替换为基于突变碱基设计的探针,其他位点探针不变,进行第二级富集捕获;文库构建中的插入DNA两端12bp自身序列作为标签进行正反双链纠错比对,提高数据利用率,实现低频精确检测,可以对0.01%低频变异具有高特异性检测。

【技术实现步骤摘要】

本专利技术属于生物信息学高通量测序
,具体涉及一种脱落细胞DNA低频突 变富集测序方法。
技术介绍
脱落细胞是指自然管腔器官内表面粘膜正常情况下,人体器官粘膜上皮细胞经常 有脱落更新,一般分为3大类:鼻咽部、口腔、食肠管、阴道等的自然脱落细胞以及部分人工 刷洗所得细胞;体腔抽出液(胸腔积液,脑脊液,心包腔积液等);针吸细胞。由于其具有安 全性,设备操作简便性,以及基于其组织病理特性,逐渐发展出一门新兴学科,脱落细胞病 理学,广泛应用于相关肿瘤早筛检测诊断中。但传统检测存在一定的误诊率,约有10-40% 假阴性,主要原因一方面是由于细胞学检查局限性,只看单个或一小堆细胞,不能全面观察 病变组织结构。另一方面脱落细胞学诊断难度较大,需要有经验的医生复验。遇到可疑或 无把握病例应重复取材,需仔细观察。此外整体的传统临床检测诊断过程依然费时,费力, 急需要一种更高精准实用性的检测手段。 目前随着分子生物学以及测序技术的飞速发展,基于高通量测序技术的脱落细胞 检测正逐步走入临床,尤其是基于宫颈脱落细胞的HPV分型的高通量测序技术以其简便, 快速,高通量,高准确性等特点,正逐步取代传统的宫颈巴氏涂片法,但是目前常规测序技 术本身存在有一定的错误率,且由于个体差异,肿瘤发生发展时期,取材操作等原因,脱落 细胞中的肿瘤细胞丰度往往存在很大波动,甚至〇. 1 %左右的低丰度水平,从而导致基于常 规测序技术仍然存在一定的假阴性以及假阳性。因此亟需一种准确率高、操作简便的测序 技术用于脱落细胞DNA的检测,为疾病的早期筛查提供可信赖的检测手段。【
技术实现思路
】 本专利技术提供一种脱落细胞DNA低频突变富集测序方法以克服现有技术的不足。 本专利技术提供的一种脱落细胞DNA低频突变富集测序方法,包括以下步骤: (1)脱落细胞的DNA提取与打断; (2)打断后的脱落细胞DNA文库构建; (3)通用文库TT-COLD PCR扩增富集; (4)探针富集捕获、杂交捕获产物的扩增与上机测序; (5)正反双链纠错低频信息分析。 本专利技术方法的流程图见图1。 其中,步骤(1)所述的脱落细胞来自人类,步骤(2)的文库构建方法按照3步酶促 反应,即末端修复,加"A"和文库接头连接。 文库接头使用的引物为: 接头第一链:TACACTCTITCCCTACACGACGCTCTTCCGATCT, 接头第二链:GATCGGAAGAGCACACGTCTGAACTCCAGTCAC。 本专利技术方法中,步骤(3)通用文库TT-COLD PCR扩增富集包括以下步骤: 1)确定文库的Tm值; 2)绕过每个插入片段存在的特异Tc值,基于1对通用引物,在1个系列的循环条 件下,对文库中所有片段上的各种突变类型进行富集;设定Tc min~TM-2. 5,之后Tc以 0.5°C逐步递增,在每个Tc条件下分别进行FULL COLD PCR;所述插入片段是指文库中与接 头连接的DNA片段。 进一步地,文库Tm值通过以下方法来确定,对正常人脱落细胞DNA的文库采用一 对引物使用荧光定量PCR,根据溶解曲线分析获得文库Tm值;所述引物的序列为: 上游引物: AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, 下游引物: CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其 中 xxxxxxxx 为 index 标签。 上述步骤2)中,所述1对通用引物为通用文库TT-COLDPCR引物,其核苷酸序列 为: 上游引物: AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, 下游引物: CAAGCAGAAGACGGCATACGAGATxxxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,其 中 xxxxxxxx 为 index 标签。 上述步骤2)中,所述1个系列循环条件为: 本专利技术方法中,步骤(4)所述探针富集捕获是将扩增后的文库质控合格后,采用 富集探针芯片进行杂交捕获,并对杂交捕获产物进行PCR扩增,然后进行上机测序; 富集探针芯片的设计方法为:基于目的基因的用途确定芯片捕获区间,参考目标 DNA所属的数据库,在一定碱基范围内,确定至少1个最重要的热点变异位点,同时针对该 位点存在的多种突变类型,以几种主要类型作为参考,基于相应的发生频率作为其在该位 点总探针覆盖水平所占的比例;针对热点变异,将基于人基因组参考序列hgl9设计的探针 替换为基于突变碱基设计的探针,其他位点探针不变,同时热点变异探针总覆盖度与其他 区域正常探针覆盖度的差异比例不少于3 :1,从而实现捕获时对热点变异的富集。 本专利技术方法中,步骤(5)正反双链纠错低频信息分析(RealSeq Pipeline)具体方 法为: 1)基于测序结果,截取成对测序序列中的测序序列一的前12bp碱基和测序序列 二的前12bp碱基作为标签,且根据字母序排列以较小的标签在前连接成24bp的一条索引, 同时根据标签的排列组合方式,选定正链和反链 2)对索引进行外部排序,以达到将同一个DNA模板的所有测序重复测序序列聚集 到一起的目的; 3)对聚集起来的拥有相同索引的测序序列进行中心聚类,根据其序列之间的汉明 距离,将每个有相同索引的大簇聚集成若干个小簇,每个小簇中任意两对成对测序序列的 汉明距离不超过10,以达到区分开拥有相同索引却来自不同DNA模板的测序序列的目的; 4)对步骤3)中获得的同一个DNA模板的重复簇进行筛选,若正链和反链的测序序 列数都达到2对以上,则进行后续分析; 5)对满足4)中条件的簇进行纠错,并产生一对无错的新测序序列.对于DNA模板 的每一个测序碱基,若某种碱基型在正链的测序序列中的一致率达到80%,且在反链测序 序列中的一致率也达到80 %,则记新测序序列的这个碱基为此碱基型,否则记为N,这样便 得到了代表原始DNA模板序列的新测序序列; 6)将新测序序列用bwa mem算法重新比对到基因组上,筛除比对质量小于30的测 序序列; 7)根据6)中得到的测序序列进行统计,得到捕获区域内每个位点的碱基型分布, 统计目标区域覆盖大小、平均测序深度,正反链互配率,低频突变率; 8)Call SNV/InDel/SV/CNV :根据患者样品与对照样品信息的比对,用mutect流 程 call somatic SNV 变异;用 gatk 流程 call somatic InDel 变异;用 contra, py 流程 call CNV ;用 somVar 流程 call SV ; 所使用的筛选参数为:对照位点变异率< 2% ;纠错后变异测序序列条数多2 ;突 变预测P值< 〇. 05 ; 9)变异注释:注释变异的功能、变异测序序列支持数、变异频率、氨基酸变异及已 有变异数据库中的该变异的情况。 进一步地,上述步骤1)中,基于插入片段两端的序列碱基作为标签,所述插入片 段是文库中与接头引物相连接的DNA片段,经双末端测序,每个片段将形成一对成对测序 本文档来自技高网...
一种脱落细胞DNA低频突变富集测序方法

【技术保护点】
一种脱落细胞DNA低频突变富集测序方法,包括以下步骤:(1)脱落细胞的DNA提取与打断;(2)打断后的脱落细胞DNA文库构建;(3)通用文库TT‑COLD PCR扩增富集;(4)探针富集捕获、杂交捕获产物的扩增与上机测序;(5)正反双链纠错低频信息分析。

【技术特征摘要】

【专利技术属性】
技术研发人员:管彦芳吕小星易鑫赵美茹刘涛杨玲
申请(专利权)人:北京吉因加科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1