一种基于二代测序数据的微卫星位点、其筛选方法技术

技术编号:37809761 阅读:15 留言:0更新日期:2023-06-09 09:39
本发明专利技术公开了一种基于二代测序数据的微卫星位点、其筛选方法,包括如下步骤:S1、选取符合条件的微卫星位点,记作位点集;S2、肿瘤样本和对照样本分别提取DNA,建库后经过靶向捕获测序;S3、获取多个微卫星稳定样本的扩增子文库的测序数据;S4、测序数据过滤含接头和低质量的序列,得到肿瘤样本和微卫星稳定样本的过滤后序列;S5、在所述比对文件中,基于显著差异的微卫星位点;S6、在所述比对文件中,统计肿瘤样本中目标区域中基因突变信息。本发明专利技术通过微卫星不稳定性检测位点选择方法,利用统计学原理选择与微卫星不稳定性相关的位点进行微卫星不稳定性检测,在没有对照组的情况,可以减少由于人群微卫星多样性带来的误差。减少由于人群微卫星多样性带来的误差。减少由于人群微卫星多样性带来的误差。

【技术实现步骤摘要】
一种基于二代测序数据的微卫星位点、其筛选方法


[0001]本专利技术涉及肝癌的早期筛查及干预
,具体涉及一种基于二代测序数据的微卫星位点、其筛选方法。

技术介绍

[0002]随着人口老龄化问题加剧,癌症的发病率越来越高。免疫治疗作为一种个性化的肿瘤治疗方法具有放疗、化疗等传统治疗方法不具备的优势,目前已在多种肿瘤如黑色素瘤,非小细胞肺癌、肾癌和前列腺癌等实体瘤的治疗中展示出了强大的抗肿瘤活性,多种肿瘤免疫治疗药物已经获得美国食品药品监督管理局批准并且在临床上得到了应用。但是免疫治疗药物并非对所有的癌症都敏感,大量的研究表明,微卫星不稳定性阳性的癌症患者接受免疫治疗后有较好的预后效果和较长的生存时间。同时,大量研究表明在结直肠癌,胃癌,子宫内膜癌中,微卫星不稳定性阳性的患者不适合使用一些化疗药物,如5

氟脲嘧啶,而更适合于免疫治疗。因此微卫星不稳定性这一表型的检测对癌症的早筛,治疗和预后都有很重要的意义。
[0003]目前采用的方式是直接提取基因组上微卫星的特征进行后续微卫星稳定性的判断,不存在计算资源和时间的问题,准确率也比较高,但是需要正常样本作对照,这不仅增加了成本而且在无法获得正常样本时不能检测,在应用上具有很大的局限性。

技术实现思路

[0004]本专利技术的目的在于提供一种基于二代测序数据的微卫星位点、其筛选方法,以解决上述
技术介绍
中提出增加了成本而且在无法获得正常样本时不能检测,在应用上具有很大的局限性的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:
[0006]一种基于二代测序数据的微卫星位点、其筛选方法,包括如下步骤:
[0007]S1、选取符合条件的微卫星位点,记作位点集;
[0008]S2、肿瘤样本和对照样本分别提取DNA,建库后经过靶向捕获测序;
[0009]S3、获取多个微卫星稳定样本的扩增子文库的测序数据,并从每个所述微卫星稳定样本的所述测序数据中筛选出所述位点集,并统计所述微卫星稳定样本位点集中每个所述微卫星位点的重复单元的类型和每个所述重复单元的类型频率;
[0010]采用多个微卫星稳定样本组成的阴性样本组和多个微卫星不稳定样本组成的阳性样本组,统计并保留所述点集中每个所述微卫星位点在所述阴性样本组和所述阳性样本组之间deletion ratio存在显著差异的微卫星位点;
[0011]S4、测序数据过滤含接头和低质量的序列,得到肿瘤样本和微卫星稳定样本的过滤后序列;将过滤后序列与位点集比对,得到位点覆盖信息的比对文件;
[0012]S5、在所述比对文件中,基于显著差异的微卫星位点,统计MLH1、MSH2、MSH6和PMS2四个MMR基因的突变信息,并进行突变功能注释;当所述MMR四个基因中有失活突变时,记为
M=1;当所述MMR四个基因中没有失活突变时,记为M=0;
[0013]S6、在所述比对文件中,统计肿瘤样本中目标区域中基因突变信息,计算肿瘤突变负荷TMB;TMB=s/N,s为所述肿瘤样本中目标区域内外显子编码区非同义体细胞突变位点总个数,单位为个;N为所述肿瘤样本中目标区域覆盖的编码区碱基兆数,单位为Mbp。
[0014]优选的,其特征在于:
[0015]步骤S1所述的条件包括:
[0016]1)7 15bp的A~或T的单碱基重复序列;
[0017]2)与所述单碱基重复序列的两翼序列相似值低于相似阈值;
[0018]3)根据测序reads的读长要求,设计各所述微卫星位点的扩增引物和测序方向,选择能使测序reads完全跨越各所述微卫星位点区域的微卫星位点。
[0019]优选的,步骤S1所述的选取符合条件的微卫星位点,采用获取数据单元进行选取,所述获取数据单元用于获取所需数据,其包含选自候选位点集中至少一个微卫星位点的信息数据。
[0020]优选的,步骤S1中所述的位点集,通过计算候选位点集中各微卫星位点对于MSI状态的贡献度,并根据贡献度大小对候选位点集中的微卫星位点进行排序,取排名前n的微卫星位点组成筛选位点集,n为10

100之间的自然数,根据n取值不同得到位点集。
[0021]优选的,步骤S3中所述的获取多个微卫星稳定样本,具体为:
[0022]1)当细胞内的错配修复系统发生缺陷时,细胞内的DNA在复制时发生错误且累积,如果模板链发生折叠则后面的子代细胞中DNA同一个位置则发生了删除的变异,如果合成链发生折叠,则后面子代细胞中的DNA同一个位置会发生插入变异;为了检测微卫星不稳定性,将DNA扩增的过程模拟为一个多项式分布;
[0023]2)计算所有样本中微卫星位点的稳定性;对于每个微卫星位点,利用非参数检验方法检验该位点稳定性是否在微卫星阴性样本中和阳性样本中具有显著差异;然后检验所有的微卫星位点,去除在阴性样本和阳性样本中没有显著差异的微卫星位点,得到有效检测位点。
[0024]优选的,所述获取多个微卫星稳定样本过程中,DNA在合成的过程中,每个碱基或者重复单元合成过程是独立的,同一个位置,模板链和合成链不会同时发生折叠现象;每个碱基或者每个单元复制时模板链折叠为事件D,其发生的概率为p;合成链折叠为事件I,其概率为q;
[0025]该位置模板链和合成链都不发生折叠为事件N,其概率为1

p

q;假设DNA在复制过程中微卫星区域碱基或者重复单元个数为L,共复制产生了m个拷贝,其中事件D发生的次数为d,事件I发生的次数为i,事件N发生的概率为n,则d+i+n=mL。
[0026]优选的,步骤S3中所述的阳性样本流程为:
[0027]计算每个样本中所有有效检测位点的稳定性,并计算不稳定位点占所有检测到有效位点的比例,然后根据比例对样本微卫星不稳定性进行判断,选取在敏感性和特异性达到最大时的值为某种肿瘤样本微卫星不稳定性的评价标准,当测试样本大于该评价标准时为微卫星不稳定性阳性,否则为微卫星不稳定性阴性。
[0028]优选的,步骤S3中还包括:
[0029]根据对某种肿瘤样本的测序数据,选择有效检测位点,计算有效检测位点对应的
单个微卫星位点不稳定性的阈值以及某种肿瘤样本微卫星不稳定性的评价标准;
[0030]根据有效检测位点对应的单个微卫星位点不稳定性的阈值以及某种肿瘤样本微卫星不稳定性的评价标准,对检测样本进行微卫星不稳定性检测。
[0031]优选的,所述对检测样本进行微卫星不稳定性检测具体过程如下:首先根据微卫星不稳定性有效检测位点的集合,扫描测序数据,获取每个微卫星位点的基因型分布,然后计算单个微卫星位点的稳定性并根据单个微卫星位点的稳定性对应的阈值判断单个微卫星的稳定性,最后某种肿瘤样本微卫星不稳定性的评价标准,对样本微卫星不稳定性进行判断,得到样本整体的微卫星稳定性结果。
[0032]综上所述,由于采用了上述技术,本专利技术的有益效果是:
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于二代测序数据的微卫星位点、其筛选方法,其特征在于,包括如下步骤:S1、选取符合条件的微卫星位点,记作位点集;S2、肿瘤样本和对照样本分别提取DNA,建库后经过靶向捕获测序;S3、获取多个微卫星稳定样本的扩增子文库的测序数据,并从每个所述微卫星稳定样本的所述测序数据中筛选出所述位点集,并统计所述微卫星稳定样本位点集中每个所述微卫星位点的重复单元的类型和每个所述重复单元的类型频率;采用多个微卫星稳定样本组成的阴性样本组和多个微卫星不稳定样本组成的阳性样本组,统计并保留所述点集中每个所述微卫星位点在所述阴性样本组和所述阳性样本组之间deletion ratio存在显著差异的微卫星位点;S4、测序数据过滤含接头和低质量的序列,得到肿瘤样本和微卫星稳定样本的过滤后序列;将过滤后序列与位点集比对,得到位点覆盖信息的比对文件;S5、在所述比对文件中,基于显著差异的微卫星位点,统计MLH1、MSH2、MSH6和PMS2四个MMR基因的突变信息,并进行突变功能注释;当所述MMR四个基因中有失活突变时,记为M=1;当所述MMR四个基因中没有失活突变时,记为M=0;S6、在所述比对文件中,统计肿瘤样本中目标区域中基因突变信息,计算肿瘤突变负荷TMB;TMB=s/N,s为所述肿瘤样本中目标区域内外显子编码区非同义体细胞突变位点总个数,单位为个;N为所述肿瘤样本中目标区域覆盖的编码区碱基兆数,单位为Mbp。2.根据权利要求1所述的一种基于二代测序数据的微卫星位点、其筛选方法,其特征在于:步骤S1所述的条件包括:1)7 15bp的A~或T的单碱基重复序列;2)与所述单碱基重复序列的两翼序列相似值低于相似阈值;3)根据测序reads的读长要求,设计各所述微卫星位点的扩增引物和测序方向,选择能使测序reads完全跨越各所述微卫星位点区域的微卫星位点。3.根据权利要求1所述的一种基于二代测序数据的微卫星位点、其筛选方法,其特征在于:步骤S1所述的选取符合条件的微卫星位点,采用获取数据单元进行选取,所述获取数据单元用于获取所需数据,其包含选自候选位点集中至少一个微卫星位点的信息数据。4.根据权利要求1所述的一种基于二代测序数据的微卫星位点、其筛选方法,其特征在于:步骤S1中所述的位点集,通过计算候选位点集中各微卫星位点对于MSI状态的贡献度,并根据贡献度大小对候选位点集中的微卫星位点进行排序,取排名前n的微卫星位点组成筛选位点集,n为10

100之间的自然数,根据n取值不同得到位点集。5.根据权利要求1所述的一种基于二代测序数据的微卫星位点、其筛选方法,其特征在于:步骤S3中所述的获取多个微卫星稳定样本,具体为:1)当细胞内的错配修复系统发生缺陷...

【专利技术属性】
技术研发人员:王思振
申请(专利权)人:无锡泛生子生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1