【技术实现步骤摘要】
一种微卫星不稳定性的分析方法和分析装置
本专利技术属于生物信息学
,涉及一种微卫星不稳定性的分析方法和分析装置。
技术介绍
“微卫星”(Microstallite)是遍布于人体基因组上的短串联重复序列,一般以1~6个碱基为重复单位,重复次数为10~50次。与正常细胞相比,肿瘤细胞由于发生错配修复(MMR)基因缺陷,微卫星的重复单位插入或缺失导致微卫星的长度发生改变,称为微卫星不稳定(MicrostalliteInstability,MSI)。MSI与肿瘤的发生紧密相关,MSI状态不同的实体瘤对Keytruda等多种免疫检查点药物的响应率显著不同。近年来随着多种免疫检查技术获批,MSI/dMMR的检测变得越来越重要。微卫星广泛分布于基因组上,平均每6kb区域存在一个20bp长度的微卫星位点,重复次数和重复程度呈高度多态性。传统的MSI检测方法多为基于5个微卫星位点的多重PCR+毛细血管电泳法,但是检测的微卫星位点数目有限;第二代测序技术(NGS)可以同时检测大量的微卫星位点,已被用于检测癌症中的MSI。国家癌症研究所(NCI)为了标准化癌症MSI检测,提出了两个单核苷酸重复(BAT-25和BAT-26)和三个双核苷酸重复(D2S123,D5S346,D17S250)作为检测微卫星位点的标志物,其中,当至少两个微卫星位点不稳定时,定义为高频MSI(MSI-H),当所有微卫星位点均稳定或有一个位点不稳定时,定义为微卫星稳定(MSS)或低频MSI(MSI-L)。在临床上MSS和MSI-L为同一组。近期, ...
【技术保护点】
1.一种微卫星不稳定性的分析方法,其特征在于,所述方法包括以下步骤:/n(1)筛选微卫星不稳定标志物,并对每一个微卫星不稳定标志物Mi构建序列列表Lmi;/n(2)将肿瘤样本和健康样本的测序数据经过过滤处理后,比对到参考基因组上,分别获得肿瘤样本比对文件和健康样本比对文件;/n(3)分别将肿瘤样本比对文件和健康样本比对文件的每对读长与微卫星位点标志物Mi的2~3kb范围内的序列进行比对,统计比对成功的读长数量,作为覆盖微卫星位点标志物Mi的总读取数Rmi、Rmi’;/n(4)分别将肿瘤样本比对文件和健康样本比对文件的每对读长与微卫星位点标志物Mi的序列列表Lmi进行比对,统计比对成功的读长数量,作为覆盖序列列表Lmi的总读取数Rni、Rni’;/n(5)计算肿瘤样本Pni=Rni/Rmi、健康样本Qni=Rni’/Rmi’;/n(6)根据Pni和Qni计算肿瘤样本和健康样本的KL散度和JS散度;/n其中,i为≤微卫星不稳定标志物个数的正整数。/n
【技术特征摘要】
1.一种微卫星不稳定性的分析方法,其特征在于,所述方法包括以下步骤:
(1)筛选微卫星不稳定标志物,并对每一个微卫星不稳定标志物Mi构建序列列表Lmi;
(2)将肿瘤样本和健康样本的测序数据经过过滤处理后,比对到参考基因组上,分别获得肿瘤样本比对文件和健康样本比对文件;
(3)分别将肿瘤样本比对文件和健康样本比对文件的每对读长与微卫星位点标志物Mi的2~3kb范围内的序列进行比对,统计比对成功的读长数量,作为覆盖微卫星位点标志物Mi的总读取数Rmi、Rmi’;
(4)分别将肿瘤样本比对文件和健康样本比对文件的每对读长与微卫星位点标志物Mi的序列列表Lmi进行比对,统计比对成功的读长数量,作为覆盖序列列表Lmi的总读取数Rni、Rni’;
(5)计算肿瘤样本Pni=Rni/Rmi、健康样本Qni=Rni’/Rmi’;
(6)根据Pni和Qni计算肿瘤样本和健康样本的KL散度和JS散度;
其中,i为≤微卫星不稳定标志物个数的正整数。
2.根据权利要求1所述的方法,其特征在于,步骤(1)所述微卫星不稳定标志物为单碱基重复长度≥15个核苷酸、双碱基或多碱基重复单位重复次数≥8的位点。
3.根据权利要求1所述的方法,其特征在于,步骤(1)所述序列列表Lmi包括微卫星位点标志物Mi的序列Sn;
所述序列Sn包括微卫星位点标志物Mi上游3~5个碱基的序列+微卫星重复单元×n+微卫星位点标志物Mi下游3~5个碱基的序列;
其中,n为0~((读长长度-上游碱基序列长度-下游碱基序列长度)÷重复单元长度)的整数。
4.根据权利要求1所述的方法,其特征在于,步骤(6)所述肿瘤样本和健康样本的KL散度的计算公式为:
KL(Pi||Qi)=Pni×log(Pni÷Qni);
KL(Qi||Pi)=∑Qni×log(Qni÷Pni)。
5.根据权利要求1所述的方法,其特征在于,步骤(6)所述肿瘤样本和健康样本的JS散度的计算公式为:
JSD(Pi||Qi)=(KL(Pi||Mi)+KL(Qi||Mi))÷2
=(∑Pni×log(Pni÷(Pni+Qni))+∑Qni×log(Qni÷(Pni+Qni)))÷2+log2
其中,Mi=(Pi+Qi)÷2。
6.根据权利要求...
【专利技术属性】
技术研发人员:全雪萍,肖燕伟,浦宇,张亚飞,
申请(专利权)人:迈杰转化医学研究苏州有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。