一种样本交叉污染的检测方法和装置制造方法及图纸

技术编号:37331929 阅读:12 留言:0更新日期:2023-04-21 23:09
本发明专利技术提供了用于检测甲基化测序中样本污染的单核苷酸多态性(SNP)位点的筛选方法以及样本污染的检测方法和装置,其中,该筛选方法包括以下步骤:S1:选取预设人群中频率在0.3~0.7之间的SNP位点;S2:选取突变方向为腺嘌呤(A)突变到胸腺嘧啶(T)或胸腺嘧啶(T)突变到腺嘌呤(A)的SNP位点;S3:选取重复区域以外的SNP位点;S4:选取相互之间物理距离大于预设长度的SNP位点。本发明专利技术可以实现低成本、高精度地对甲基化测序中样本污染进行检测。对甲基化测序中样本污染进行检测。

【技术实现步骤摘要】
一种样本交叉污染的检测方法和装置


[0001]本专利技术涉及生物
,具体涉及一种样本交叉污染的检测方法,针对DNA甲基化二代测序样本的单核苷酸多态性等位基因频率进行监控,提供样本是否有交叉污染的判断。

技术介绍

[0002]重亚硫酸盐甲基化测序(BS

seq,bisulfite sequencing)作为甲基化测序的金标准,以其单碱基分辨率、高通量的特点,其作用在癌症筛查、诊断,以及监控的作用越来越被认识。在高通量二代测序(NGS,Next generation sequencing)检测中,由于多个样本是并行处理,所以在样本储存、制备等过程中导致的相邻样本之间异源DNA交叉污染的风险是难以排除的。而这个风险在早期肿瘤的诊断筛查中,一旦发生后果更加严重,因为早期肿瘤的血液样本中肿瘤组分通常占比很低(<0.001),血液样本的痕量污染即可造成筛查或者诊断结果错误,而目前的NGS污染检测方法,往往无法达到对<0.001的污染比例的检测敏感度。而且目前常用的NGS的样本污染判定中,通常会在各个批次的样本中设计阳性参考品和阴性参考品,然而在真实的临床实践中,由于对于成本的控制和考量而忽略参考品的设置,这也提高了样本发生交叉污染而不能准确识别的风险。

技术实现思路

[0003]本专利技术为克服现有技术中的不足,本专利技术提供了一种样本交叉污染的检测方法和装置,该检测方法和相应的装置可以低成本、高精度的对血液游离DNA样本中是否存在来自其他样本的污染进行判断。
[0004]在一方面,本专利技术提供了一种用于检测甲基化测序中样本污染的单核苷酸多态性(SNP)位点的筛选方法,包括以下步骤:
[0005]S1:选取预设人群中频率在0.3~0.7之间的SNP位点;
[0006]S2:选取突变方向为腺嘌呤(A)突变到胸腺嘧啶(T)或胸腺嘧啶(T)突变到腺嘌呤(A)的SNP位点;
[0007]S3:选取重复区域以外的SNP位点;
[0008]S4:选取相互之间物理距离大于预设长度的SNP位点;
[0009]任选地,S2和S3的顺序互换。
[0010]另一方面,本专利技术提供了一种用于检测甲基化测序中样本污染的方法,包括以下步骤:
[0011](1)获取对待测样本进行甲基化测序后得到的测序信息;
[0012](2)根据如上述方法筛选到的用于检测甲基化测序中样本污染的SNP位点确定样本污染状态。
[0013]另一方面,本专利技术提供了一种用于检测甲基化测序中样本污染的装置,包括:
[0014]测序信息获取模块,被配置成获取对待测样本进行甲基化测序后得到的测序信
息;
[0015]样本状态确定模块,被配置成根据如上述方法筛选到的用于检测甲基化测序中样本污染的SNP位点确定样本污染状态。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
[0017]图1示出了不同SNPs数量场景下,模拟污染样本在取不同范围的SNP位点时所对应的不同阈值条件的样本污染指数(SCS),针对单一SCS阈值,模拟污染的掺比梯度分别为:0005pct(0.005%)、001pct(0.01%)、005pct(0.05%)、001pct(0.01%)、05pct(0.5%)和1pct(1%)。其中,图1a为50SNPs的情况;图1b为100SNPs的情况;图1c为200SNPs的情况;图1d为300SNPs的情况;图1e为400SNPs的情况;图1f为500SNPs的情况;图1g为600SNPs的情况。
[0018]图2示出了模拟污染样本在取相同范围(AR值波动前20%)的SNP位点时,不同SNPs数量场景下多种掺比的模拟污染样本的样本污染指数。
[0019]图3示出了不同cfDNA掺比情况下,污染样本的AR频率分布图,其中横坐标为AR值,纵坐标为SNP位点数量。其中,图3a为无掺比的本底样本;图3b为掺比万分之一的污染样本;图3c为掺比万分之五的污染样本;图3d为掺比千分之一的污染样本;图3e为掺比千分之五的污染样本。
[0020]图4示出了参考示例,上方显示的一段预期进行甲基化检测的双链DNA片段,按箭头方向排序,其包含原始上链(CCGGCATGTTTAAACGCT)和原始下链(AGCGTTTAAACATGCCGG),其中部分假定所有CpG中的胞嘧啶(C)都发生了甲基化,以

mC标识出。上述双链DNA片段经过变性解旋为单链形式后,经过重亚硫酸盐转化处理,原始上链和原始下链中未被甲基化(

mC)修饰的C被转化为尿嘧啶(U),而甲基化修饰的C则依然保持为C。在随后的PCR扩增过程中,由于尿嘧啶(U)与腺嘌呤(A)互补配对,而DNA的PCR扩增中引入的与腺嘌呤(A)配对碱基为胸腺嘧啶(T)。在PCR扩增中,首先形成了与重亚硫酸盐处理后的带有尿嘧啶(U)的原始上链互补的目标上链互补链(CTOT),以及与重亚硫酸盐处理后的带有尿嘧啶(U)的原始下链互补的目标下链互补链(CTOB)。在之后的PCR扩增过程中,形成了由原始上链转化的与CTOT互补的目标上链(OT),以及由原始下链转化的与CTOB互补的目标下链(OB)。对比可知,原始上链和原始下链中的未被甲基化修饰的C在目标上链和目标下链中被T取代,而甲基化修饰的C(以下划线标识出)则保持不变。根据这一特点,可以通过测定重亚硫酸盐转化处理后的C来识别经甲基化修饰的C的数量与位置,从而实现DNA甲基化检测的目的。
具体实施方式
[0021]I.定义
[0022]在本专利技术中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本专利技术,下面提供相关术语的定义和解释。
[0023]术语“SNP”(Single Nucleotide Polymorphism,单核苷酸多态性)主要是指基因组水平上由单个核苷酸的变异所引起的DNA(Deoxyribo Nucleic Acid,脱氧核糖核酸)序列多态性。SNP位点所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换或颠换所引起,也可以是碱基的插入或缺失所致。
[0024]术语“纯合SNP位点”是指一种SNP位点,在该位点上,所有与参考基因组进行比对的序列上的该位点都显示相同的碱基,且该碱基与参考基因组序列上该位点的碱基不同。例如,若参考基因组序列上某SNP位点上的碱基为G,而所有与参考基因组进行比对的序列上的该SNP位点上的碱基都为A,则该SNP位点则被称为纯合SNP位点。
[0025]术语“等位基因”(allele),是指位于一对同源染色体相同位置上控制同一性状不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于检测甲基化测序中样本污染的单核苷酸多态性(SNP)位点的筛选方法,其包括以下步骤:S1:选取预设人群中频率在0.3~0.7之间的SNP位点;S2:选取突变方向为腺嘌呤(A)突变到胸腺嘧啶(T)或胸腺嘧啶(T)突变到腺嘌呤(A)的SNP位点;S3:选取重复区域以外的SNP位点;S4:选取相互之间物理距离大于预设长度的SNP位点;任选地,所述S2和所述S3的顺序互换。2.根据权利要求1所述的方法,其中,所述S1中的SNP位点选取自预设数据库,所述预设数据库选自gnomAD数据库、1000Genome Project数据库、HapMap数据库、dbSNP数据库中的一个或多个;优选地,所述预设数据库为gnomAD数据库;其中,参考基因组为GRCh37/hg19或GRCh38/hg38人类参考基因组。3.根据权利要求1或2所述的方法,其中,所述预设人群选自东亚人群、非洲/非裔美国人群、拉丁美洲人群、非芬兰欧洲人群、芬兰欧洲人群、艾希肯纳兹犹太人群或西亚人群;优选地,所述预设人群为东亚人群。4.根据权利要求1

3任一项所述的方法,其中,所述S4中所述预设长度为0.4~1Mb;优选地,所述预设长度为0.4Mb;更优选地,所述预设长度为1Mb。5.用于检测甲基化测序中样本污染的方法,其包括以下步骤:(1)获取对待测样本进行甲基化测序后得到的测序信息;(2)根据如权利要求1

4中任一项所述的方法筛选到的用于检测甲基化测序中样本污染的SNP位点确定样本污染状态。6.根据权利要求5所述的方法,其中,所述步骤(2)包括:确定所述待测样本中对应于所述用于检测甲基化测序中样本污染的SNP位点中的纯合SNP位点;优选地,确定所述纯合SNP位点的方法包括计算所述用于检测甲基化测序中样本污染的SNP位点的突变等位基因比率(AR);更...

【专利技术属性】
技术研发人员:李冰思唐诗灿邱福俊张之宏汉雨生
申请(专利权)人:广州燃石医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1