【技术实现步骤摘要】
一种基于二代测序的微卫星不稳定性检测方法及装置
[0001]本专利技术属于生物信息学
,具体公开了一种基于二代测序的微卫星不稳定性检测方法及装置。
技术介绍
[0002]微卫星(Microsatellite,简称MS),又称短串联重复序列(Short tandem repeats,STRs)或简单串联重复序列(Simple Sequence Repeat,SSR),广泛存在于原核生物及真核生物基因组中,其重复单元为1~6个核苷酸,一般由10~50个重复单元串联组成。由于序列中核心重复单元重复次数的差异,微卫星具有群体多态性,其总长度常小于400bp,常见的有单核苷酸、双核甘酸、三核苷酸、四核苷酸重复序列,在真核生物基因组中约占5%。
[0003]在人类基因组中,微卫星单核苷酸重复以polyA、polyT为主,双核苷酸重复以(CA)n、(GT)n、(AA)n、(GG)n常见,(GC/CG)少见,原因在于3
’
端为G的C(即CPG)易于甲基化;而三核苷酸重复以(CXG)n为主,由于三核苷酸重复具有 ...
【技术保护点】
【技术特征摘要】
1.一种基于二代测序的微卫星不稳定性检测方法,其特征在于:所述方法包括以下步骤:获得待测样本中候选微卫星位点的测序读段;获得待测样本中候选微卫星位点的平均缺失单元数;检测待测样本中候选微卫星位点的MSI状态;评估待测样本的MSI状态。2.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述平均缺失单元数根据所述微卫星位点的测序读段和参考基因组上对应位点重复单元的重复次数计算得到;优选地,所述平均缺失单元数的计算公式为:式中:R为参考基因组上所述微卫星位点重复单元的重复次数;N为样本中涵盖所述微卫星位点的总的测序读段数;i为样本中所述微卫星位点重复单元的某一重复次数;n
i
为样本中所述微卫星位点重复单元对应某一重复次数的测序读段数;i为整数,1≤i<R;n
i
为整数,n
i
≤N。3.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述待测样本中候选微卫星位点的MSI状态的检测方法为:将获得的待测样本中每个候选微卫星位点的平均缺失单元数与对应位点设定的阈值进行比较,超出阈值的位点判定为存在微卫星不稳定性;反之,判定为微卫星稳定。4.根据权利要求3所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述阈值的设定是基于多个微卫星稳定的样本所获得的候选微卫星位点的平均缺失单元数的平均值μ和标准差σ确定的;优选地,所述阈值的设定采用以下方法:提供背景集,所述背景集中仅包含多个微卫星稳定的样本;获得样本中候选微卫星位点的测序读段;获得样本中候选微卫星位点的平均缺失单元数;获得样本中每个候选微卫星位点的平均缺失单元数的平均值μ和标准差σ,据此将每个候选微卫星位点的阈值设定为μ与3σ的加和。5.根据权利要求1所述的基于二代测序的微卫星不稳定性检测方法,其特征在于:所述评估待测样本的MSI状态的方法为:获得待测样本中存在微卫星不稳定性的候选微卫星位点的数量,统计其在总的候选微卫星位点数量中的占比,将...
【专利技术属性】
技术研发人员:张莉娟,董超,张银,张晓亮,张瑞峰,
申请(专利权)人:郑州安图生物工程股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。