本申请涉及一种判别MET基因拷贝数扩增类型的方法及装置,具体涉及一种拷贝数扩增类型判别方法,包含将待测样本与参考样本组比较,预测MET及周边参考基因捕获区间的拷贝数,预测MET拷贝数状态,基于MET基因捕获区间的拷贝数与周边参考基因的拷贝数分布的KL散度判别MET基因拷贝数扩增类型。MET基因拷贝数扩增类型。MET基因拷贝数扩增类型。
【技术实现步骤摘要】
一种判别MET基因拷贝数扩增类型的方法及装置
[0001]本申请涉及生物信息领域,具体涉及一种MET基因拷贝数扩增状态的判别方法及其应用。
技术介绍
[0002]MET基因,全名间质上皮转化因子(c
‑
Met),位于人类7号染色体长臂(7q21
‑
q31)。是一种原癌基因,其编码的跨膜受体蛋白具有酪氨酸激酶活性,因此是一种酪氨酸激酶,与多种癌基因产物和调节蛋白有关,参与细胞信息传导、细胞骨架重排的调控,是细胞增殖、分化和运动的重要因素。肝细胞生长因子(HGF)/c
‑
met信号通路在原发性肿瘤的形成及继发转移中起着至关重要的作用。
[0003]MET基因拷贝数扩增包括两组类型:1)局部扩增(focal amplification,又称定点扩增);2)整体染色体重复(polysomy,又称多倍体扩增)。整体染色体重复即肿瘤细胞中出现多条7号染色体短臂和/或长臂,也称为多倍体。多倍体在生物学中不能作为驱动基因,局部扩增可能作为驱动基因,也是EGFR耐药的主要机制之一。多种实体瘤中都发现原发MET扩增,根据肿瘤基因组计划(TCGA)和cBioPortal数据库提供的数据,MET扩增在不同的实体瘤中发生率存在一定的差异。非小细胞肺癌(NSCLC)的检出率约为1~5%,胃癌中约为1~10%,结肠癌中约为2~4%,I型和II型肾乳头状癌约为13%和3%左右,在食管癌和肝细胞癌中检出比例较低。在许多恶性肿瘤中,MET扩增意味着预后不良。研究发现,非小细胞肺癌中MET扩增度越高,肿瘤MET驱动依赖性越强。MET高度扩增(MET/CEP7≥5,FISH)的非小细胞肺癌患者,很少伴发其他致癌基因的驱动突变(如EGFR突变或ALK融合等),而在MET低度扩增(1.8≤MET/CEP7≤2.2,FISH)和中度扩增(2.2<MET/CEP7<5,FISH)的患者中,更多伴发其他驱动突变。此外,MET高度扩增患者的客观反应率(ORR)和中位生存期(PFS)显著性高于低度扩增和中度扩增患者。
[0004]常见的MET扩增检测技术包括荧光原位杂交(FISH)、实时定量PCR(qRT PCR)和二代测序(NGS)。FISH是目前公认为检测MET扩增的金标准,其原理为通过计算MET探针与7号染色体着丝粒(CEP7)探针的信号比(MET/CEP7)或单位细胞中MET的拷贝数(GCN)来判断MET的扩增状态。FISH具有实验周期短,特异性高,定位准确等优点,但是对操作和判读的要求较高,不同实验室/实验者对结果的判读差异较大,而且无法适用于大规模筛查,单次只能判断单基因的扩增状态。目前,临床上对于NGS检测MET扩增的定义没有达到共识。目前大部分平台均基于读短深度(read depth)原理,使用MET基因与7号染色体片段的拷贝数比例,并使用一些生物信息学方法进行计算,然而在敏感性和特异性上有一定的局限性。
技术实现思路
[0005]针对现有技术存在的不足和实际需求,本专利技术提供一种判别MET拷贝数扩增类型的方法及装置。
[0006]本专利技术提供以下技术方案:
第一方面,本专利技术提供一种判别MET拷贝数扩增类型的方法或装置。该方法或装置包括如下步骤,或执行如下步骤的模块:(1)获取待测样本的测序数据(例如通过:测序模块):a)将高通量测序原始数据回帖到人类参考基因组;b)去除PCR过程中产生的重复序列;c)计算捕获区间的覆盖深度,具体可以是,计算目标区域上每个碱基的测序深度;d)对深度进行矫正,包括样本总测序深度矫正,具体可以是,对每个目标区间各个位点上的覆盖深度根据样本总测序深度进行标准化,以消除不同样本之前的测序数据量差异;根据探针铺设特征进行矫正,具体可以是,根据探针设计中不同区间探针铺设乘数差异,例如根据区间上覆盖的探针数,将区间分割,每个目标区间长度可以为约24个碱基对,并计算各个目标区间平均覆盖深度,根据每个目标区间上覆盖的探针数,对目标区间上测序深度进行局部加权回归矫正;根据GC含量进行矫正,具体可以是,将用于覆盖深度计算的目标区间按照侧翼延伸至总长大于200bp长度,计算平均GC占比,根据各区间的GC占比,对测序深度进行局部加权回归矫正,得到GC矫正后的测序深度;(2)评估MET基因及周边参考基因各捕获区域的拷贝数(例如通过:拷贝数评估模块):a)待测样本与背景基线比较,计算MET基因及周边参考基因各捕获区间的拷贝数;b)所述周边参考基因包括EGFR和BRAF,CDK6和BRAF,EGFR、CDK6和BRAF,三种组合;(3)评估MET基因的拷贝数状态(例如通过:拷贝数状态评估模块):a)评估MET基因的拷贝数,具体可以是,计算待测样本MET基因及周边参考基因的加权平均拷贝数,使用该基因上外线子的长度对区间的拷贝数进行矫正;b)评估MET基因各个区间发生拷贝数扩增的概率,具体可以是,区间的测序深度与背景基线的分布进行正态性检验,计算显著性p值;c)评估MET基因显著性比例,具体可以是,计算MET基因发生显著性扩增的区间占MET基因所有区间的比例;d)评估MET基因整体水平的显著性,具体可以是,对MET基因的所有区间矫正之后的测序深度,与参考基线中MET的所有区间的平均测序深度,进行T检验,判断MET基因在样本与基线中的差异是否显著,计算显著性p值;e)确定MET基因的拷贝数状态,判断标准为:各个阈值可通过使用大规模样本训练得到。其中:CN
thA
表示拷贝数扩增的阈值,取值可以任选为2.25~4;CN
thD
表示拷贝数缺失的阈值,取值可以任选为1.0~1.75;sigRatio
th
表示显著性扩增/缺失比例的阈值,取值可以任选为0.3~1;p
th
表示显著性T检验的阈值,取值可以任选为0.05~0.00001。
[0007](4)对于MET基因拷贝数扩增的情况,评估MET基因与周边参考基因的离散程度,例如:KL散度(例如通过:离散度评估模块):a)将MET基因及周边参考基因各个捕获区间的拷贝数转化为log2Ratio;b)将所有捕获区间的log2Ratio划分为多个区间;c)分别计算MET基因及周边参考基因的log2Ratio落在每个区间上的概率分布,即
为P和Q,其中P表示MET基因各个区间的概率分布,Q表示周边参考基因各个区间的概率分布;d)计算MET基因及周边参考基因的两个概率分布P和Q的KL散度(Kullback
‑
Leibler Divergence);机器学习中常见的散度距离包括:F
‑
散度(F
‑
divergence),JS散度(Jensen
–
Shannon divergence)等。
[0008](5)基于KL散度判别MET基因的扩增类型(例如通过:判断模块):a)使用拷贝数和KL散度两个指标判别MET基因的扩增类型,具体如下:i.MET基因的拷贝数高于EGFR和BRA本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种检测MET基因拷贝数扩增类型的方法,其特征在于,包括如下步骤:(1)获取待测样本的高通量测序数据;(2)评估MET基因及MET周边参考基因各捕获区域的拷贝数;(3)评估MET基因的拷贝数状态,如果MET基因的拷贝数评估为缺失或正常,则不再进行后续步骤;如果MET基因的拷贝数评估为扩增,则进行以下步骤判别其扩增类型;(4)评估MET基因与MET周边参考基因的离散程度:(5)基于所述MET基因与MET周边参考基因的拷贝数和离散程度,判别MET基因的扩增类型。2.根据权利要求1所述的方法,其特征在于,评估MET基因的拷贝数状态的标准为:其中:CN
thA
表示拷贝数扩增的阈值,取值为2.25~4;CN
thD
表示拷贝数缺失的阈值,取值为1.0~1.75;sigRatio
th
表示显著性扩增/缺失比例的阈值,取值为0.3~1;p
th
表示显著性T检验的阈值,取值为0.05~0.00001。3.根据权利要求1所述的方法,其特征在于,所述MET周边参考基因包括3种组合类型,所述3种组合类型包括EGFR和BRAF,或者CDK6和BRAF,或者EGFR、CDK6和BRAF。4.根据权利要求3所述的方法,其特征在于,所述评估MET基因及MET周边参考基因各捕获区域的拷贝数,是通过将所述待测样本与基线比较,计算MET基因及周边参考基因各捕获区间的拷贝数。5.根据权利要求1所述的方法,其特征在于,所述评估MET基因与MET周边参考基因的离散程度为评估MET基因与MET周边参考基因的KL散度、或F
‑
散度(F
‑
divergence),或JS散度(Jensen
–
Shannon divergence)。6.根据权利要求5所述的方法,其特征在于,评估MET基因与MET周边参考基因的KL散度,包括如下步骤:a)将MET基因及周边参考基因各个捕获区间的拷贝数转化为log2Ratio;b)将所有捕获区间的log2Ratio划分为多个区间;c)分别计算MET基因及周边参考基因的log2Ratio落在每个区间上的概率分布,即为P和Q,其中P表示MET基因各个区间的概率分布,Q表示周边参考基因各个区间的概率分布;d)计算MET基因及周边参考基因的两个概率分布P和Q的KL散度(Kullback
‑
Leibler Divergence)。7...
【专利技术属性】
技术研发人员:汉雨生,刘成林,旷婷,张周,揣少坤,
申请(专利权)人:广州燃石医学检验所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。