【技术实现步骤摘要】
一种判别淋巴瘤分子亚型的方法、装置和存储介质
[0001]本申请涉及淋巴瘤分子分型
,特别是涉及一种判别淋巴瘤分子亚型的方法、装置和存储介质。
技术介绍
[0002]淋巴瘤是起源于淋巴造血系统的恶性肿瘤,是常见的血液肿瘤。近年来淋巴瘤发病率呈现上升的趋势,有数据表明,目前淋巴瘤居各类癌症的第8位。虽然淋巴瘤发病率不及肺癌、胃癌;但是,在整个血液肿瘤中,淋巴瘤是发病率最高的类型,远远高于白血病的发病率。从地域分布来说,发达城市和地区发病率显著高于农村及偏远地区。随着精准医学的步入,淋巴瘤的治疗也进入免疫治疗新阶段。
[0003]淋巴瘤可分为霍奇金淋巴瘤(HL)和非霍奇金淋巴瘤(NHL)两类,分别约占所有淋巴瘤的10%、90%。而非霍奇金淋巴瘤(NHL)又可分为B细胞淋巴瘤(约占85%)、T/NK细胞淋巴瘤(约占15%)。研究显示,在非霍奇金淋巴瘤(NHL)中占比最多的是弥漫大B细胞淋巴瘤(DLBCL);除此之外,还包括伯基特淋巴瘤(BL)、高级别B细胞淋巴瘤(HGBL)等。
[0004]目前,DLBCL的治疗普遍采用免疫化疗方案,尤其是R
‑
CHOP治疗方案使得DLBCL患者的长期存活率得到明显改善。临床试验结果显示,相比于传统的CHOP方案,R
‑
CHOP方案治疗DLBCL能显著延长患者的中位总生存时间达4.9年、中位无病生存时间超过6.6年,5年无疾病进展生存率从30%提高至54%。
[0005]全球每年约15万例新发DLBCL,约占所有NHL的30 ...
【技术保护点】
【技术特征摘要】
1.一种判别淋巴瘤分子亚型的方法,其特征在于:包括以下步骤,体系SNV突变位点集获取步骤,包括获取待测肿瘤样本的比对结果文件,分析待测肿瘤样本的SNV突变位点及各SNV突变位点的突变频率、突变位点深度,对SNV突变位点进行注释,筛选突变频率大于1%、且注释Function信息为missense的突变位点,作为体系SNV突变位点集;基因层面拷贝数变异检测步骤,包括根据待测肿瘤样本的比对结果文件和待测肿瘤样本配对的血细胞样本的比对结果文件,分析待测肿瘤样本发生CNV突变的区段,对CNV突变区域进行注释,筛选保留ratio阈值范围内的CNV突变,即Gain ratio大于等于1.4,loss小于等于0.8的CNV突变,作为可信CNV突变区域集,组成待测肿瘤样本的基因层面拷贝数变异信息;染色体臂层面拷贝数变异检测步骤,包括分析获得所有染色体臂发生拷贝数变异的区域的起始位置、终止位置、染色体多体性状态和染色体臂杂合性缺失状态,组成待测肿瘤样本的染色体臂层面拷贝数变异信息;基因层面结构变异检测步骤,包括获取待测肿瘤样本的SV突变位点集合,包括发生SV结构变异的基因,及SV的起始、终止位置;待测肿瘤样本所属亚型判别步骤,包括根据待测肿瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息,结合淋巴瘤分子亚型显著突变特征数据库,利用最大似然估计方法计算和分析待测肿瘤样本所属的淋巴瘤分子亚型;所述淋巴瘤分子亚型显著突变特征数据库,是以若干已知淋巴瘤分子亚型的淋巴瘤样本作为确定突变特征集的训练样本,根据淋巴瘤样本四个维度突变信息,人工判断得到每个训练样本所属的亚型,统计各亚型的训练样本中突变特征的突变频率,对每个突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,筛选显著的突变特征,且该突变特征的训练样本频率大于20%,构建每个亚型的显著突变特征集,从而获得淋巴瘤分子亚型显著突变特征数据库;所述四个维度突变信息包括淋巴瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息。2.根据权利要求1所述的方法,其特征在于:所述基因层面拷贝数变异检测步骤,包括使用cnvkit软件析待测肿瘤样本发生CNV突变的区段,具体的,将基线文件作为cnvkit软件的输入文件,同时使用待测肿瘤样本的比对结果文件作为cnvkit软件的输入文件,进行待测肿瘤样本发生CNV突变区段的分析;所述基线文件为待测肿瘤样本同批次的若干个血细胞样本的比对结果文件;优选的,所述染色体臂层面拷贝数变异检测步骤,对待测肿瘤样本的所有染色体进行CNVLOH分析,检测获得染色体臂层面拷贝数变异信息;优选的,所述待测肿瘤样本所属亚型判别步骤,利用最大似然估计方法计算和分析待测肿瘤样本所属的淋巴瘤分子亚型,具体包括,利用最大似然估计方法计算待测肿瘤样本在每个亚型的似然概率值,按照如下的判断规则,输出待测肿瘤样本所属的淋巴瘤分子亚型,(1)当只有一个亚型的似然概率大于90%时,则判断待测肿瘤样本为该亚型;(2)当存在多个亚型的似然概率大于90%时,则判断待测肿瘤样本为混合型;
(3)当亚型似然概率在50%~90%之间时,则最大似然概率的亚型为待测肿瘤样本亚型;(4)当所有亚型的似然概率均小于50%时,则待测肿瘤样本为无法判断出亚型。3.一种淋巴瘤分子亚型显著突变特征数据库的构建方法,其特征在于:包括以若干已知淋巴瘤分子亚型的淋巴瘤样本作为确定突变特征集的训练样本,根据淋巴瘤样本四个维度突变信息,人工判断得到每个训练样本所属的亚型,统计各亚型的训练样本中突变特征的突变频率,对每个突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,筛选显著的突变特征,且该突变特征的训练样本频率大于20%,构建每个亚型的显著突变特征集,从而获得淋巴瘤分子亚型显著突变特征数据库;所述四个维度突变信息包括淋巴瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息;所述基因层面拷贝数变异信息包括可信CNV突变区域集;所述染色体臂层面拷贝数变异信息包括所有染色体臂发生拷贝数变异的区域的起始位置、终止位置、染色体多体性状态和染色体臂杂合性缺失状态;所述基因层面结构变异信息包括所有SV突变位点集,包括发生SV结构变异的基因,及SV的起始、终止位置。4.根据权利要求3所述的构建方法,其特征在于:所述体系SNV突变位点集的获得方法包括,获取淋巴瘤样本的比对结果文件,分析淋巴瘤样本的SNV突变位点,及各SNV突变位点的突变频率、突变位点深度,对SNV突变位点进行的注释,筛选突变频率大于1%、且注释Function信息为missense的突变位点,作为体系SNV突变位点集;优选的,所述基因层面拷贝数变异信息的获得方法包括,根据肿瘤样本的比对结果文件和肿瘤样本配对的血细胞样本的比对结果文件,分析肿瘤样本发生CNV突变的区段,对CNV突变区域进行注释,筛选保留ratio阈值范围内的CNV突变,即Gain ratio大于等于1.4,loss小于等于0.8的CNV突变,作为可信CNV突变区域...
【专利技术属性】
技术研发人员:管彦芳,李彩琴,程海楠,刘涛,方欢,杜新华,郝时光,
申请(专利权)人:深圳基因家科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。