一种基于二代测序的微卫星不稳定性检测方法及装置制造方法及图纸

技术编号:33403842 阅读:22 留言:0更新日期:2022-05-11 23:26
本发明专利技术属于生物信息学技术领域,具体公开了一种基于二代测序的微卫星不稳定性检测方法及装置。本发明专利技术的检测方法利用二代测序技术获得的测序读段,先计算得到待测样本中每个候选微卫星位点的平均缺失单元数,据此检测每个微卫星位点的MSI状态,再以此评估待测样本的MSI状态。本发明专利技术将微卫星位点的平均缺失单元数作为特征值,无需使用参考样本,也不用比较每个位点的多态分布,检测原理简单,计算简便,对测序深度的要求低,临床可实施性好,稳定性高,检测结果准确可靠,与PCR金标准的一致性为100%。100%。100%。

【技术实现步骤摘要】
一种基于二代测序的微卫星不稳定性检测方法及装置


[0001]本专利技术属于生物信息学
,具体公开了一种基于二代测序的微卫星不稳定性检测方法及装置。

技术介绍

[0002]微卫星(Microsatellite,简称MS),又称短串联重复序列(Short tandem repeats,STRs)或简单串联重复序列(Simple Sequence Repeat,SSR),广泛存在于原核生物及真核生物基因组中,其重复单元为1~6个核苷酸,一般由10~50个重复单元串联组成。由于序列中核心重复单元重复次数的差异,微卫星具有群体多态性,其总长度常小于400bp,常见的有单核苷酸、双核甘酸、三核苷酸、四核苷酸重复序列,在真核生物基因组中约占5%。
[0003]在人类基因组中,微卫星单核苷酸重复以polyA、polyT为主,双核苷酸重复以(CA)n、(GT)n、(AA)n、(GG)n常见,(GC/CG)少见,原因在于3

端为G的C(即CPG)易于甲基化;而三核苷酸重复以(CXG)n为主,由于三核苷酸重复具有高度多态性,常用作DNA标记物。研究表明,当人体错配修复(Mismatch repair,简称MMR)机制发生缺陷时,微卫星序列会出现长度的变化,成为微卫星不稳定性(Microsatellite instability,简称MSI)。微卫星不稳定性与肿瘤的发生密切相关,尤其是结直肠癌等胃肠道癌症,在肿瘤的治疗和预后中具有重要的作用。例如,在结直肠癌患者中,微卫星高度不稳定(MSI
/>H)的患者相较微卫星低度不稳定(MSI

L)或微卫星稳定(Microsatellite stability,MSS)的患者预后更好。
[0004]为实现微卫星不稳定性的评估,中国专利申请CN112955570A(Lexent)公开了一种方法,包括:从受试者的血浆样本(cfDNA)中获取多个微卫星重复单元的量化量度,处理该多个量化量度以获得其偏差的统计量度,当多个量化量度的偏差的统计量度满足预定标准时,检测微卫星不稳定性存在,反之,检测不存在。该方法将样本中所有微卫星位点整合在一起计算平均长度的偏差的统计量度(相对参考样本的平均z分数,且测序深度在10
×
以下),在一定程度上可以评估受试者的MSI状态,但是需要参考样本,临床可实施性差,且未检测单个位点的MSI状态,准确性不高。此外,中国专利申请CN112639983A(Roche)公开了一种微卫星不稳定性检测方法,包括:检测来自人基因组DNA的多个微卫星位点的测序读段,确定每个微卫星位点的重复长度分布(RLD)的度量,比较该度量与对应位点的阈值,统计超出阈值的微卫星位点的数量,比较该数量与设定的微卫星不稳定性比例阈值,超出的判定为人存在微卫星不稳定性。该方法的度量标准为待测样本RLD与对照RLD之间的相似性度量,比如根据位点RLD的平均读段长度和方差确定的t统计量(也即比较每个位点的多态分布),操作复杂,计算量大,在实际应用中存在一定的不便利性。
[0005]因此,有必要开发一种原理简单、稳定性强、准备性高的微卫星不稳定性检测方法。

技术实现思路

[0006]本专利技术主要解决的技术问题是提供一种基于二代测序的微卫星不稳定性检测方法,该方法原理简单、计算简便,稳定性高,可重复性强,检测结果准确、可靠。
[0007]同时,本专利技术还提供一种用于检测微卫星不稳定性的装置。
[0008]为解决上述技术问题,本专利技术采用以下技术方案:
[0009]第一方面,本专利技术提供了一种基于二代测序的微卫星不稳定性检测方法,包括以下步骤:
[0010]获得待测样本中候选微卫星位点的测序读段;
[0011]获得待测样本中候选微卫星位点的平均缺失单元数;
[0012]检测待测样本中候选微卫星位点的MSI状态;
[0013]评估待测样本的MSI状态。
[0014]作为本专利技术一种优选的实施方案,所述待测样本来源于人类或非人类哺乳动物,优选为组织样本或血液样本。
[0015]具体的,所述组织样本为肿瘤样本,如新鲜组织样本、冷冻组织样本、FFPE样本等。
[0016]具体的,所述血液样本包括全血样本、血浆样本等。
[0017]作为本专利技术一种优选的实施方案,所述候选微卫星位点为单核苷酸重复位点、双核苷酸重复位点、三核苷酸重复位点中的任意一种或多种。
[0018]优选地,所述候选微卫星位点为单核苷酸重复位点。
[0019]作为本专利技术一种优选的实施方案,所述候选微卫星位点的选取有特定的要求,具体为:
[0020]提供训练集,所述训练集中包含多个存在微卫星不稳定性的样本和多个微卫星稳定的样本;
[0021]基于训练集,获得每个微卫星位点的分类性能,所述分类性能用auc值表示,选取auc值≥0.65的微卫星位点作为候选微卫星位点。
[0022]所述auc值介于0~1之间,越接近1代表微卫星位点的分类性能越好。在实际应用中,优选auc值≥0.65的单核苷酸重复的微卫星位点。当然,也可以对每个微卫星位点的auc值进行大小排序,选取auc值高的多个位点作为候选微卫星位点。
[0023]作为本专利技术一种优选的实施方案,所述auc值在计算时,以平均缺失单元数作为特征值。
[0024]具体的,所述auc值的获取采用以下方法:
[0025]基于训练集,获得样本中每个微卫星位点的测序读段;
[0026]获得样本中每个微卫星位点的平均缺失单元数;
[0027]将所有样本中同一微卫星位点的平均缺失单元数作为特征值送入机器学习模型,得到每个微卫星位点的auc值。
[0028]优选地,所述机器学习模型使用随机森林模型,也可以使用其他适合的机器学习模型。
[0029]作为本专利技术一种优选的实施方案,所述候选微卫星位点的数目至少为50个。数目越多,越能保证检测方法的准确性。
[0030]作为本专利技术一种优选的实施方案,所述平均缺失单元数根据所述微卫星位点的测
序读段和参考基因组上对应位点重复单元的重复次数计算得到。每个微卫星位点都能计算得到对应的平均缺失单元数。
[0031]具体的,所述平均缺失单元数的计算公式为:
[0032][0033]式中:
[0034]R为参考基因组上所述微卫星位点重复单元的重复次数。
[0035]N为样本中涵盖所述微卫星位点的总的测序读段数(即总reads数)。
[0036]i为样本中所述微卫星位点重复单元的某一重复次数。
[0037]例如,参考基因组chr1:10177680位置处重复单元A的重复次数为12,样本中实测的重复单元A的重复次数可能为9、10或11。
[0038]n
i
为样本中所述微卫星位点重复单元对应某一重复次数的测序读段数。
[0039]例如,对于上述重复单元A,实测的对应重复次数为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于二代测序的微卫星不稳定性检测方法,其特征在于:所述方法包括以下步骤:获得待测样本中候选微卫星位点的测序读段;获得待测样本中候选微卫星位点的平均缺失单元数;检测待测样本中候选微卫星位点的MSI状态;评估待测样本的MSI状态。2.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述平均缺失单元数根据所述微卫星位点的测序读段和参考基因组上对应位点重复单元的重复次数计算得到;优选地,所述平均缺失单元数的计算公式为:式中:R为参考基因组上所述微卫星位点重复单元的重复次数;N为样本中涵盖所述微卫星位点的总的测序读段数;i为样本中所述微卫星位点重复单元的某一重复次数;n
i
为样本中所述微卫星位点重复单元对应某一重复次数的测序读段数;i为整数,1≤i<R;n
i
为整数,n
i
≤N。3.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述待测样本中候选微卫星位点的MSI状态的检测方法为:将获得的待测样本中每个候选微卫星位点的平均缺失单元数与对应位点设定的阈值进行比较,超出阈值的位点判定为存在微卫星不稳定性;反之,判定为微卫星稳定。4.根据权利要求3所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述阈值的设定是基于多个微卫星稳定的样本所获得的候选微卫星位点的平均缺失单元数的平均值μ和标准差σ确定的;优选地,所述阈值的设定采用以下方法:提供背景集,所述背景集中仅包含多个微卫星稳定的样本;获得样本中候选微卫星位点的测序读段;获得样本中候选微卫星位点的平均缺失单元数;获得样本中每个候选微卫星位点的平均缺失单元数的平均值μ和标准差σ,据此将每个候选微卫星位点的阈值设定为μ与3σ的加和。5.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述评估待测样本的MSI状态的方法为:获得待测样本中存在微卫星不稳定性的候选微卫星位点的数量,统计其在总的候选微卫星位点数量中的占比,将...

【专利技术属性】
技术研发人员:张莉娟董超张银张晓亮张瑞峰
申请(专利权)人:郑州安图生物工程股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1