一种矫正同源重组缺陷评分的方法、装置和存储介质制造方法及图纸

技术编号:32363817 阅读:9 留言:0更新日期:2022-02-20 03:35
本申请公开了一种矫正同源重组缺陷评分的方法、装置和存储介质。本申请方法包括获取待测样本的体系CNV和体系SNV;利用体系CNV和SNV,计算待测样本最优模型下的WGD值,及原始的LOH score值、TAI score值、LSTscore值;对发生WGD的待测样本,矫正LST score值=(1

【技术实现步骤摘要】
一种矫正同源重组缺陷评分的方法、装置和存储介质


[0001]本申请涉及同源重组缺陷评分方法
,特别是涉及一种矫正同源重组缺陷评分的方法、装置和存储介质。

技术介绍

[0002]研究数据表明,女性同胞中卵巢癌的发病例逐年增加,死亡率也在增加;大多数卵巢癌患者发现已经是晚期,5年生存率不足30%;因此,卵巢癌已经成为女性最致命的恶性肿瘤之一。但是,随着PARP抑制剂的来临,给卵巢癌患者带了新的希望。2014年后多个PARP抑制剂陆续获批上市,极大地提高了卵巢癌患者的生存率,提高了生存的效益。卵巢癌PARP抑制剂的生物标记物从BRCA基因拓展到HRD(同源重组缺陷)状态,意味着卵巢癌获益人群将从20%左右扩展到50%以上,这对改善患者生存预后有极大帮助。
[0003]DNA同源重组修复(Homologous Recombination Repair,HRR)是DNA双链损伤的重要修复方式。HRR是一条涉及到多个步骤的复杂的信号通路,其中关键蛋白为BRCA1和BRCA2。当HRR出现问题时,会导致不能对聚集的双链DNA损伤进行修复,进而导致细胞的死亡,这种缺陷简称HRD(Homologous Recombination Deficiency),即同源重组修复缺陷。当发生同源重组修复缺陷时,在基因组层面主要的不稳定表现为:基因组杂合缺失(LOH),端粒等位基因不平衡(TAI),大片段迁移(LST)。利用捕获测序数据对LOH、TAI、LST三个指标进行检测,进而评估HRD状态,即同源重组缺陷评分,这种结合染色体层面的检测相对比较全面,PARPi获益人群更广泛。
[0004]然而,现有的同源重组缺陷评分方法无法解决对发生全基因组倍增(WGD,whole

genome doubling)的肿瘤样本存在LST、TAI两个指标评分偏高的问题,存在由于发生WGD的因素导致灵敏度低、准确率低等缺陷。因此,如何更灵敏、准确的获得同源重组缺陷评分,是同源重组缺陷状态评估亟待解决的问题。

技术实现思路

[0005]本申请的目的是提供一种新的矫正同源重组缺陷评分的方法、装置和存储介质。
[0006]为了实现上述目的,本申请采用了以下技术方案:
[0007]本申请的第一方面公开了一种矫正同源重组缺陷评分的方法,包括以下步骤,
[0008]体系CNV和体系SNV突变集获取步骤,包括获取待测样本的体系CNV突变和体系SNV突变;
[0009]全基因组倍增WGD值获取步骤,包括利用获得的体系CNV突变和体系SNV突变,计算待测样本最优模型下的WGD值;
[0010]同源重复缺陷评分步骤,包括利用获得的体系CNV突变和体系SNV突变,计算待测样本的原始LOH score值、原始TAI score值、原始LST score值;
[0011]矫正步骤,包括对发生WGD的待测样本(WGD=1/2),利用第一矫正系数k1矫正原始LST score值,利用第二矫正系数k2矫正原始TAI score值,
[0012]矫正后LST score值=(1

k1
×
WGD值)
×
原始LST score值,
[0013]矫正后TAI score值=(1

k2
×
WGD值)
×
原始TAI score值,
[0014]矫正后的同源重组缺陷评分HRD score值为矫正后LST score值、矫正后TAIscore值和原始LOH score值的加和。
[0015]需要说明的是,本申请的关键在于利用WGD值对HRD score值进行矫正,具体的,创造性的提出利用WGD值对TAI score值和LST score值进行矫正;从而解决发生全基因组倍增的肿瘤样本存在LST、TAI两个指标评分偏高的问题;使得矫正后的同源重组缺陷评分HRD score值能够更灵敏、准确的用于同源重组缺陷状态评估。
[0016]还需要说明的是,本申请中,第一矫正系数k1和第二矫正系数k2是采用已知样本作为训练集训练获得的矫正系数。例如,本申请的一种实现方式中,矫正系数训练方法包括,采用穷举方法,以步长为0.1遍历0到1内的所有值作为LST score值、TAI score值的矫正系数,筛选BRCA阳性HRD阳性比例大于0.95、BRCA阴性HRD阳性比例小于0.5、P_value大于0.1的系数组合;其中P_value是WGD等于0样本集对应的HRD score和WGD不等于0样本集对应的HRD score值;结合筛选后的每个遍历系数下WGD

和WGD+样本集的HRD score值的秩和检验及利用训练集样本生存数据得到的HR、95%置信区间、预后价值四个维度的结果,训练获得第一矫正系数k1和第二矫正系数k2,以及HRD score阈值。
[0017]本申请的一种实现方式中,矫正步骤的第一矫正系数k1为0.3,第二矫正系数k2为0.4。
[0018]需要说明的是,第一矫正系数k1为0.3,第二矫正系数k2为0.4是本申请实施例中采用穷举方法遍历LST、TAI两个指标的系数,以BRCA阳性HRD阳性达到文献报道值以上、BRCA阴性HRD阳性达到文献报道值以下为目标确定的LST、TAI两个指标的系数。可以理解,按照相同的研究思路,第一矫正系数和第二矫正系数还可以是其他的具体数值。
[0019]本申请的一种实现方式中,体系CNV和体系SNV突变集获取步骤,具体是利用GATK软件检测CNV突变,结合配对样本CNV结果,过滤胚系CNV突变,得到体系CNV突变;利用Mutect2软件检测SNV突变,结合配对样本SNV结果,过滤胚系SNV突变,得到体系SNV突变。
[0020]需要说明的是,GATK软件检测CNV突变、Mutect2软件检测SNV突变以及具体的胚系突变过滤都只是本申请的一种实现方式中具体采用的方案,不排除还可以采用其他常规的CNV突变检测软件、SNV突变检测软件和胚系突变过滤方法。
[0021]本申请的一种实现方式中,全基因组倍增WGD值获取步骤中,计算待测样本最优模型下的WGD值,具体包括,利用体系CNV突变和体系SNV突变作为软件ABSOLUTE的输入,输出待测样本若干个模型下模拟的WGD值、purity值、ploidy值,对于预测得到的模型进行筛选确定最优模型,获得最优模型下的WGD值。
[0022]本申请的一种实现方式中,同源重复缺陷评分步骤中,计算待测样本的原始LOH score值、原始TAI score值、原始LST score值,具体包括,利用体系CNV突变和体系SNV突变作为软件scarHRD的输入,输出待测样本的原始LOH score值、原始TAI score值、原始LST score值。
[0023]本申请的第二方面公开了一种矫正同源重组缺陷评分的装置,包括体系CNV和体系SNV突变集获取模块、全基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种矫正同源重组缺陷评分的方法,其特征在于:包括以下步骤,体系CNV和体系SNV突变集获取步骤,包括获取待测样本的体系CNV突变和体系SNV突变;全基因组倍增WGD值获取步骤,包括利用获得的体系CNV突变和体系SNV突变,计算待测样本最优模型下的WGD值;同源重复缺陷评分步骤,包括利用获得的体系CNV突变和体系SNV突变,计算待测样本的原始LOH score值、原始TAI score值、原始LST score值;矫正步骤,包括对发生WGD的待测样本,利用第一矫正系数k1矫正原始LST score值,利用第二矫正系数k2矫正原始TAI score值,矫正后LST score值=(1

k1
×
WGD值)
×
原始LST score值,矫正后TAI score值=(1

k2
×
WGD值)
×
原始TAI score值,矫正后的同源重组缺陷评分HRD score值为矫正后LST score值、矫正后TAI score值和原始LOH score值的加和。2.根据权利要求1所述的方法,其特征在于:所述体系CNV和体系SNV突变集获取步骤,包括利用GATK软件检测CNV突变,结合配对样本CNV结果,过滤胚系CNV突变,得到体系CNV突变;利用Mutect2软件检测SNV突变,结合配对样本SNV结果,过滤胚系SNV突变,得到体系SNV突变。3.根据权利要求1所述的方法,其特征在于:所述全基因组倍增WGD值获取步骤中,计算待测样本最优模型下的WGD值包括,利用体系CNV突变和体系SNV突变作为软件ABSOLUTE的输入,输出待测样本若干个模型下模拟的WGD值、purity值、ploidy值,对于预测得到的模型进行筛选确定最优模型,获得最优模型下的WGD值。4.根据权利要求1

3任一项所述的方法,其特征在于:所述同源重复缺陷评分步骤中,计算待测样本的原始LOH score值、原始TAI score值、原始LST score值包括,利用体系CNV突变和体系SNV突变作为软件scarHRD的输入,输出待测样本的原始LOH score值、原始TAI score值、原始LST score值。5.一种矫正同源重组缺陷评分的装置,其特征在于:包括体系CNV和体系SNV突变集获取模块、全基因组倍增WGD值获取模块、同源重复缺陷评分模块和矫正模块,所述体系CNV和体系SNV突变集获取模块,包括用于获取待测样本的体系CNV突变和体系SNV突变;所述全基因组倍增...

【专利技术属性】
技术研发人员:管彦芳李彩琴刘涛程海楠方欢
申请(专利权)人:深圳基因家科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1