一种判别淋巴瘤分子亚型的方法、装置和存储介质制造方法及图纸

技术编号:32460423 阅读:16 留言:0更新日期:2022-02-26 08:47
本申请公开了一种判别淋巴瘤分子亚型的方法、装置和存储介质。本申请方法包括获取待测肿瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息,结合淋巴瘤分子亚型显著突变特征数据库,利用最大似然估计方法分析待测肿瘤样本的淋巴瘤分子亚型;淋巴瘤分子亚型显著突变特征数据库是若干已知淋巴瘤分子亚型的训练样本,统计各亚型突变特征,并对各突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,最终筛选获得显著且训练样本频率大于20%的突变特征。本申请方法能准确、灵敏的判别待测肿瘤样本的淋巴瘤分子亚型,为淋巴瘤分子分型判别提供了一种新的方案和途径。和途径。和途径。

【技术实现步骤摘要】
一种判别淋巴瘤分子亚型的方法、装置和存储介质


[0001]本申请涉及淋巴瘤分子分型
,特别是涉及一种判别淋巴瘤分子亚型的方法、装置和存储介质。

技术介绍

[0002]淋巴瘤是起源于淋巴造血系统的恶性肿瘤,是常见的血液肿瘤。近年来淋巴瘤发病率呈现上升的趋势,有数据表明,目前淋巴瘤居各类癌症的第8位。虽然淋巴瘤发病率不及肺癌、胃癌;但是,在整个血液肿瘤中,淋巴瘤是发病率最高的类型,远远高于白血病的发病率。从地域分布来说,发达城市和地区发病率显著高于农村及偏远地区。随着精准医学的步入,淋巴瘤的治疗也进入免疫治疗新阶段。
[0003]淋巴瘤可分为霍奇金淋巴瘤(HL)和非霍奇金淋巴瘤(NHL)两类,分别约占所有淋巴瘤的10%、90%。而非霍奇金淋巴瘤(NHL)又可分为B细胞淋巴瘤(约占85%)、T/NK细胞淋巴瘤(约占15%)。研究显示,在非霍奇金淋巴瘤(NHL)中占比最多的是弥漫大B细胞淋巴瘤(DLBCL);除此之外,还包括伯基特淋巴瘤(BL)、高级别B细胞淋巴瘤(HGBL)等。
[0004]目前,DLBCL的治疗普遍采用免疫化疗方案,尤其是R

CHOP治疗方案使得DLBCL患者的长期存活率得到明显改善。临床试验结果显示,相比于传统的CHOP方案,R

CHOP方案治疗DLBCL能显著延长患者的中位总生存时间达4.9年、中位无病生存时间超过6.6年,5年无疾病进展生存率从30%提高至54%。
[0005]全球每年约15万例新发DLBCL,约占所有NHL的30%,通常表现为进行性淋巴结肿大,淋巴结外病变等。DLBCL患者60%以上可通过R

CHOP免疫化疗方案治愈,治疗失败患者通常预后不良。另外,DLBCL的COO分型非常重要。精准的COO分型必须基于基因表达谱(GEP)数据,将DLBCL按照细胞起源(COO)分为生发中心B细胞样亚型(germinalcenter B

cell

like,GCB)、活化B细胞样亚型(activated B

cell

like,ABC)和无法分类的亚型(unclassified,UC)。总之,DLBCL

COO亚型是评估患者预后的重要因素。
[0006]目前现有的DLBCL的COO分型主要是全基因组表达谱分析方法和免疫组化(IHC)方法。全基因组表达谱分析方法是DLBCL分子分型的金标准;但是,该方法存在步骤繁多,容易造成信号丢失,造成假阴性结果等问题。免疫组化(IHC)方法准确度较低,由于结果的解读存在主观性,除此之外,只能判断GCB、非GCB(即nonGCB)两种类型,无法满足精准分型的临床需求,且非GCB型灵敏度较低。特别是随着淋巴瘤研究的深入,DLBCL不断出现一些新的亚型分类,例如MCD亚型、BN2亚型、N1亚型、EZB亚型、A53亚型、ST2亚型等,免疫组化(IHC)方法显然无法应对这些新的亚型分类。
[0007]总的来说,目前现有的COO分型方法,存在操作繁琐、准确度、灵敏度低等问题。如何提高淋巴瘤分子分型的准确性和灵敏度,如何消除传统方法只能局限于少数亚型分类的局限性,从而更好的满足精准分型的临床需求,是淋巴瘤分子分型
亟待解决的问题。

技术实现思路

[0008]本申请的目的是提供一种新的判别淋巴瘤分子亚型的方法、装置和存储介质。
[0009]为了实现上述目的,本申请采用了以下技术方案:
[0010]本申请的第一方面公开了一种判别淋巴瘤分子亚型的方法,包括以下步骤:
[0011]体系SNV突变位点集获取步骤,包括获取待测肿瘤样本的比对结果文件,分析待测肿瘤样本的SNV突变位点及各SNV突变位点的突变频率、突变位点深度,对SNV突变位点进行注释,筛选突变频率大于1%、且注释Function信息为missense的突变位点,作为体系SNV突变位点集;
[0012]基因层面拷贝数变异检测步骤,包括根据待测肿瘤样本的比对结果文件和待测肿瘤样本配对的血细胞样本的比对结果文件,分析待测肿瘤样本发生CNV突变的区段,对CNV突变区域进行注释,筛选保留ratio阈值范围内的CNV突变,即Gain ratio大于等于1.4,loss小于等于0.8的CNV突变,作为可信CNV突变区域集,组成待测肿瘤样本的基因层面拷贝数变异信息;
[0013]染色体臂层面拷贝数变异检测步骤,包括分析获得所有染色体臂发生拷贝数变异的区域的起始位置、终止位置、染色体多体性状态和染色体臂杂合性缺失状态,组成待测肿瘤样本的染色体臂层面拷贝数变异信息;
[0014]基因层面结构变异检测步骤,包括获取待测肿瘤样本的SV突变位点集合,包括发生SV结构变异的基因,及SV的起始、终止位置;
[0015]待测肿瘤样本所属亚型判别步骤,包括根据待测肿瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息,结合淋巴瘤分子亚型显著突变特征数据库,利用最大似然估计方法计算和分析待测肿瘤样本所属的淋巴瘤分子亚型;
[0016]其中,淋巴瘤分子亚型显著突变特征数据库,是以若干已知淋巴瘤分子亚型的淋巴瘤样本作为确定突变特征集的训练样本,根据淋巴瘤样本四个维度突变信息,人工判断得到每个训练样本所属的亚型,统计各亚型的训练样本中突变特征的突变频率,对每个突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,筛选显著的突变特征,且该突变特征的训练样本频率大于20%,构建每个亚型的显著突变特征集,从而获得淋巴瘤分子亚型显著突变特征数据库;所述四个维度突变信息包括淋巴瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息。
[0017]需要说明的是,本申请判别淋巴瘤分子亚型的方法,利用待测肿瘤样本四个维度突变信息,即待测肿瘤样本可信的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息,结合淋巴瘤分子亚型显著突变特征数据库,能够准确、灵敏的获得待测肿瘤样本的淋巴瘤分子亚型;并且,本申请的方法所能够分析的亚型不受限于GCB和nonGCB,本申请的一种实现方式中,能够实现对MCD亚型、BN2亚型、N1亚型、EZB亚型、A53亚型、ST2亚型六种亚型的准确、灵敏分型。
[0018]本申请的一种实现方式中,基因层面拷贝数变异检测步骤,包括使用cnvkit软件析待测肿瘤样本发生CNV突变的区段,具体的,将基线文件作为cnvkit软件的输入文件,同时使用待测肿瘤样本的比对结果文件作为cnvkit软件的输入文件,进行待测肿瘤样本发生
CNV突变区段的分析;其中,基线文件为待测肿瘤样本同批次的若干个血细胞样本的比对结果文件。例如,本申请的一种实现方式中,采用了30个血细胞样本的比对结果文件作为基线文件。
[0019]需要说明的是,为了确保基线的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种判别淋巴瘤分子亚型的方法,其特征在于:包括以下步骤,体系SNV突变位点集获取步骤,包括获取待测肿瘤样本的比对结果文件,分析待测肿瘤样本的SNV突变位点及各SNV突变位点的突变频率、突变位点深度,对SNV突变位点进行注释,筛选突变频率大于1%、且注释Function信息为missense的突变位点,作为体系SNV突变位点集;基因层面拷贝数变异检测步骤,包括根据待测肿瘤样本的比对结果文件和待测肿瘤样本配对的血细胞样本的比对结果文件,分析待测肿瘤样本发生CNV突变的区段,对CNV突变区域进行注释,筛选保留ratio阈值范围内的CNV突变,即Gain ratio大于等于1.4,loss小于等于0.8的CNV突变,作为可信CNV突变区域集,组成待测肿瘤样本的基因层面拷贝数变异信息;染色体臂层面拷贝数变异检测步骤,包括分析获得所有染色体臂发生拷贝数变异的区域的起始位置、终止位置、染色体多体性状态和染色体臂杂合性缺失状态,组成待测肿瘤样本的染色体臂层面拷贝数变异信息;基因层面结构变异检测步骤,包括获取待测肿瘤样本的SV突变位点集合,包括发生SV结构变异的基因,及SV的起始、终止位置;待测肿瘤样本所属亚型判别步骤,包括根据待测肿瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息,结合淋巴瘤分子亚型显著突变特征数据库,利用最大似然估计方法计算和分析待测肿瘤样本所属的淋巴瘤分子亚型;所述淋巴瘤分子亚型显著突变特征数据库,是以若干已知淋巴瘤分子亚型的淋巴瘤样本作为确定突变特征集的训练样本,根据淋巴瘤样本四个维度突变信息,人工判断得到每个训练样本所属的亚型,统计各亚型的训练样本中突变特征的突变频率,对每个突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,筛选显著的突变特征,且该突变特征的训练样本频率大于20%,构建每个亚型的显著突变特征集,从而获得淋巴瘤分子亚型显著突变特征数据库;所述四个维度突变信息包括淋巴瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息。2.根据权利要求1所述的方法,其特征在于:所述基因层面拷贝数变异检测步骤,包括使用cnvkit软件析待测肿瘤样本发生CNV突变的区段,具体的,将基线文件作为cnvkit软件的输入文件,同时使用待测肿瘤样本的比对结果文件作为cnvkit软件的输入文件,进行待测肿瘤样本发生CNV突变区段的分析;所述基线文件为待测肿瘤样本同批次的若干个血细胞样本的比对结果文件;优选的,所述染色体臂层面拷贝数变异检测步骤,对待测肿瘤样本的所有染色体进行CNVLOH分析,检测获得染色体臂层面拷贝数变异信息;优选的,所述待测肿瘤样本所属亚型判别步骤,利用最大似然估计方法计算和分析待测肿瘤样本所属的淋巴瘤分子亚型,具体包括,利用最大似然估计方法计算待测肿瘤样本在每个亚型的似然概率值,按照如下的判断规则,输出待测肿瘤样本所属的淋巴瘤分子亚型,(1)当只有一个亚型的似然概率大于90%时,则判断待测肿瘤样本为该亚型;(2)当存在多个亚型的似然概率大于90%时,则判断待测肿瘤样本为混合型;
(3)当亚型似然概率在50%~90%之间时,则最大似然概率的亚型为待测肿瘤样本亚型;(4)当所有亚型的似然概率均小于50%时,则待测肿瘤样本为无法判断出亚型。3.一种淋巴瘤分子亚型显著突变特征数据库的构建方法,其特征在于:包括以若干已知淋巴瘤分子亚型的淋巴瘤样本作为确定突变特征集的训练样本,根据淋巴瘤样本四个维度突变信息,人工判断得到每个训练样本所属的亚型,统计各亚型的训练样本中突变特征的突变频率,对每个突变特征在某亚型和其他亚型的支持的训练样本数进行Fisher检验,筛选显著的突变特征,且该突变特征的训练样本频率大于20%,构建每个亚型的显著突变特征集,从而获得淋巴瘤分子亚型显著突变特征数据库;所述四个维度突变信息包括淋巴瘤样本的体系SNV突变位点集、基因层面拷贝数变异信息、染色体臂层面拷贝数变异信息和基因层面结构变异信息;所述基因层面拷贝数变异信息包括可信CNV突变区域集;所述染色体臂层面拷贝数变异信息包括所有染色体臂发生拷贝数变异的区域的起始位置、终止位置、染色体多体性状态和染色体臂杂合性缺失状态;所述基因层面结构变异信息包括所有SV突变位点集,包括发生SV结构变异的基因,及SV的起始、终止位置。4.根据权利要求3所述的构建方法,其特征在于:所述体系SNV突变位点集的获得方法包括,获取淋巴瘤样本的比对结果文件,分析淋巴瘤样本的SNV突变位点,及各SNV突变位点的突变频率、突变位点深度,对SNV突变位点进行的注释,筛选突变频率大于1%、且注释Function信息为missense的突变位点,作为体系SNV突变位点集;优选的,所述基因层面拷贝数变异信息的获得方法包括,根据肿瘤样本的比对结果文件和肿瘤样本配对的血细胞样本的比对结果文件,分析肿瘤样本发生CNV突变的区段,对CNV突变区域进行注释,筛选保留ratio阈值范围内的CNV突变,即Gain ratio大于等于1.4,loss小于等于0.8的CNV突变,作为可信CNV突变区域...

【专利技术属性】
技术研发人员:管彦芳李彩琴程海楠刘涛方欢杜新华郝时光
申请(专利权)人:深圳基因家科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1