一种用于检测样本污染水平的SNP位点的筛选方法及样本污染水平的检测方法技术

技术编号:33547111 阅读:27 留言:0更新日期:2022-05-26 22:42
本发明专利技术公开了一种用于检测样本污染水平的SNP位点的筛选方法及样本污染水平的检测方法,涉及生物测序技术领域,该筛选方法包括获取目标区域中人群突变频率为30%~70%的SNP位点作为候选标记位点;将单一染色体上存在的所述候选标记位点中的起始位点和终止位点之间的区域划分为多个选择区域,所述选择区域的长度为0.7~1.3Mb;若所述选择区域内存在两个及以上的候选标记位点,则选择该选择区域内等位基因频率为40%~60%且不同基因型最符合哈迪

【技术实现步骤摘要】
一种用于检测样本污染水平的SNP位点的筛选方法及样本污染水平的检测方法


[0001]本专利技术涉及生物测序
,具体而言,涉及一种用于检测样本污染水平的SNP位点的筛选方法及样本污染水平的检测方法。

技术介绍

[0002]第二代测序NGS技术因其高通量低成本的特点快速发展并应用与肿瘤临床样本的基因组测序中。然而,多样本并行建库测序导致了样本间数据污染的问题。肿瘤临床样本多采用肿瘤-对照的配对设计,采用对照样本过滤肿瘤样本中存在的对应样本的胚系突变。通常,肿瘤样本的污染会导致大量异源污染的胚系突变被错误的判定为体细胞突变,从而导致检测出的体细胞突变中存现大量假阳性突变。同时,异源污染会使得肿瘤样本的纯度下降,进而导致肿瘤样本中的体细胞突变的检测敏感性降低。因此,准确地检测肿瘤临床样本的污染水平是不可或缺的质控步骤。
[0003]全基因组测序(Whole Genome Sequence,WGS)和全外显子测序(Whole Exome Sequence,WES)能够覆盖一定量的人群多态性单核苷酸多态性(Single Nucleotide 本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于检测样本污染水平的SNP位点的筛选方法,其特征在于,获取目标区域中人群突变频率为30%~70%的SNP位点作为候选标记位点;将单一染色体上存在的所述候选标记位点中的起始位点和终止位点之间的区域划分为多个选择区域,所述选择区域的长度为0.7~1.3Mb;若所述选择区域内存在两个及以上的候选标记位点,则选择该选择区域内等位基因频率为40%~60%且不同基因型最符合哈迪-温格伯平衡的位点作为标记位点,并去除该选择区域内的其他候选标记位点。2.根据权利要求1所述的用于检测样本污染水平的SNP位点的筛选方法,其特征在于,所述不同基因型最符合哈迪-温格伯平衡的位点是指:在所述选择区域内位点不均衡系数U最小的位点,所述位点不均衡系数U的计算公式如下:U=(S
0-0.25)2+(S
1-0.5)2+(S
2-0.25)2;其中,S0、S1和S2分别为野生型、突变杂合型和突变纯合型在目标区域中的人群出现频率。3.根据权利要求2所述的用于检测样本污染水平的SNP位点的筛选方法,其特征在于,当一个所述选择区域内,所述最符合哈迪-温格伯平衡的位点存在多个时,选择其中任意一个;优选地,所述SNP候选位点是基于N例无污染的阴性样本基因组中的人群突变频率为30%~70%的SNP位点;优选地,所述N≥50;优选地,所述N≥100。4.根据权利要求1~3任一项所述的用于检测样本污染水平的SNP位点的筛选方法,其特征在于,所述SNP候选位点为基因数据库中出现频率为40%~60%的位点。5.一种用于检测样本污染水平的方法,其特征在于,其包括:使用如权利要求1~4任一项所述的用于检测样本污染水平的SNP位点的筛选方法筛选得到的污染标记位点。6.根据权利要求5所述的用于检测样本污染水平的方法,其特征在于,所述方法包括:将待测样本和/或无污染对照样本...

【专利技术属性】
技术研发人员:柳焱白健王寅屈紫薇吴琳
申请(专利权)人:北京和瑞精准医疗器械科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1