一种同源重组修复缺陷的评估方法、装置和存储介质制造方法及图纸

技术编号:32833788 阅读:15 留言:0更新日期:2022-03-26 20:50
本申请公开了一种同源重组修复缺陷的评估方法、装置和存储介质。本申请方法包括,获取待测样本低深度全基因组测序数据,去接头,比对到参考基因组上,过滤PCR重复序列;对数据进行质控和污染数据过滤,然后用ACE软件进行CNV分析,获得total CNA谱;根据total CNA谱计算LST值,并采用WGD情况校正LST值;根据BRCA基因型别和校正LST值判断HRD为阳性或阴性。本申请方法利用低深度全基因组测序数据进行LST值计算,并采用WGD情况校正LST值;无需LOH和TAI等其他基因组瘢痕标志物,可直接用校正LST值进行HRD状态评估,提高了PARP抑制剂治疗预测及预后的有效性和准确性。预后的有效性和准确性。预后的有效性和准确性。

【技术实现步骤摘要】
一种同源重组修复缺陷的评估方法、装置和存储介质


[0001]本申请涉及同源重组修复缺陷评估
,特别是涉及一种同源重组修复缺陷的评估方法、装置和存储介质。

技术介绍

[0002]同源重组修复(homologous recombination repair,HRR)是DNA双链断裂(double strand break,DSB)的首选修复方式。同源重组修复缺陷(homologous recombination deficiency,HRD)通常指细胞水平上的HRR功能障碍状态,可由HRR相关基因胚系突变或体细胞突变以及表观遗传失活等诸多因素导致,常存在于多种恶性肿瘤中,在卵巢癌、乳腺癌、胰腺导管癌、前列腺癌等肿瘤中尤其突出。HRD会产生特定的、可量化的、稳定的基因组改变,可通过建立基于基因组特征分析的评估体系来预测肿瘤HRD状态及其程度,已成为晚期卵巢癌患者临床应用聚腺苷二磷酸核糖聚合酶[poly(ADP

ribose)polymerase,PARP]抑制剂的新型生物标志物,也可能对乳腺癌、前列腺癌等肿瘤的PARP抑制剂和铂类药物的临床用药具有指导价值。最近的上皮性卵巢癌PARP抑制剂相关生物标志物检测的专家共识中指出,HRD检测被推荐用于指导一线新诊断卵巢癌的治疗方案选择,建议卵巢癌患者确诊就应进行HRD检测,包含BRCA基因检测,其结果对维持治疗的疗效预测及预后判断具有重要参考价值。目前,HRD作为反应肿瘤患者化疗敏感度、后期靶向治疗的最重要的生物标志物,已经成为卵巢癌治疗重要的一步。r/>[0003]HRD临床检测所描述的肿瘤基因组特定改变,也被称为“基因组瘢痕”。自2012年以来,杂合性缺失(loss of heterozygosity,LOH)、端粒等位基因不平衡(telomeric allelic imbalance,TAI)、大片段迁移(large

scale state transition,LST)等被作为基因组瘢痕标志物,以量化基因组瘢痕的程度。LOH定义为大于15Mb且小于整个染色体长度的杂合性缺失;TAI定义为延伸到其中一个亚端粒但不超过着丝粒且大于11Mb的等位基因不平衡的染色体片段;LST定义为两个相邻区域之间的染色体断裂位点,肿瘤基因组截断点的总数可以用来描述基因组的不稳定性。其中,相邻区域是指两个区域长度均大于或等于10Mb,且区域间距小于3Mb。LOH、TAI和LST等3个指标都有独特的定义,在一定程度上能描述细胞HRD状态的程度。
[0004]现有技术普遍采用基因芯片捕获测序或高深度全基因组测序进行同源重组修复缺陷的基因瘢痕评估。但是,基因芯片捕获测序存在数据误差较大的问题,而全基因组测序对测序深度要求较高。此外,国外文章ShallowHRD:detection of homologous recombination deficiency from shallow whole genome sequencing中尝试采用低深度全基因组数据计算LST,但真实临床样本的性能差,并且,对发生全基因组复制的样本存在指标评分偏高、灵敏度低、准确率低等问题。因此,如何更简单、灵敏、准确的对同源重组修复缺陷的基因瘢痕进行评估,是目前亟待解决的问题。

技术实现思路

[0005]本申请的目的是提供一种新的同源重组修复缺陷的评估方法、装置和存储介质。
[0006]为了实现上述目的,本申请采用了以下技术方案:
[0007]本申请的第一方面公开了一种同源重组修复缺陷的评估方法,包括以下步骤:
[0008]全基因组测序数据获取和比对步骤,包括获取待测样本的低深度全基因组测序下机数据,去除接头,将其比对到参考基因组上,根据比对排序过滤PCR产生的重复序列,获得比对文件;
[0009]全基因组测序数据质控步骤,包括对比对文件进行质量分析,获得包括比对率、测序深度、GC含量和重复率在内的质量信息,根据质量信息过滤获取合格的测序数据;
[0010]污染数据过滤步骤,包括对测序数据进行污染率分析,分析其受污染情况,获取污染率小于污染率阈值的测序数据;
[0011]拷贝数变异分析步骤,包括采用ACE软件确定低深度全基因组测序样本的肿瘤纯度,并且生成total CNA谱;其中,total CNA谱包含样本名、染色体、起始位置、终止位置、拷贝数和segments片段信息;
[0012]LST值计算步骤,包括根据total CNA谱计算样本的LST值,具体的,删除小于3M的segments片段,绘制segments片段密度分布图;取第一个局部最小值为CNA cutoff;若特定区间0.025到0.45之间不存在局部最小值,则将CNA cutoff设置为segments片段密度曲线第一个峰中出现的小拐点,通过降低CNA cutoff,使样本的LST增加;当相邻两个segments片段小于CNA cutoff,则将两个segments片段拟合;计算CNA cutoff的规则包括,若局部最小值大于0.025且小于0.45,取第一个局部最小值作为CNA cutoff;若局部最小值小于0.025时,取0.025作为CNA cutoff;若局部最小值大于0.45时,取0.45作为CNA cutoff;当局部最小值大于0.45时,且密度图在0.45之前出现导数值减小但未改变正负的小拐点时,计算0.025到0.45之间密度图的导数,导数的最小值对应的差值作为CNA cutoff;当相邻两个segments片段差值大于CNA cutoff,同时间隔小于3Mb,且长度均大于10Mb,则LST值加1;可以理解,LST的定义为相邻两个segments片段的间隔小于3Mb,且长度均大于10Mb;因此相邻两个segments要有断点,即高度差,CNA cutoff是计算出来的高度差;当高度差越小,相应找到的LST会更多,则LST值越大;因此,本申请通过降低CNA cutoff,使样本的LST增加;
[0013]待测样本全基因组复制分析步骤,包括判断待测样本是否发生全基因组复制,如果有发生全基因组复制,并且样本segments片段极差大于2,同时segments片段密度图中峰值个数大于4,则LST值减9,作为最终的LST值;
[0014]同源重组修复缺陷状态评估步骤,包括根据BRCA基因型别和最终的LST值判断同源重组修复缺陷状态为阳性或阴性。
[0015]本申请中,局部最小值即对密度分布图取导数时,导数等于0对应的第一个局部最小值所在的点。
[0016]需要说明的是,本申请的同源重组修复缺陷评估方法,可以直接采用低深度全基因组测序数据进行LST值计算,并采用全基因组复制情况对LST值进行校正,使得校正后的LST值可以直接单独与BRCA基因型别结合用于同源重组修复缺陷状态评估;并且,由于校正后的LST值计算更准确,提高了其作为PARP抑制剂治疗及预后的中间参考数据的有效性和准确性。
[0017]本申请的一种实现方式中,全本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种同源重组修复缺陷的评估方法,其特征在于:包括以下步骤,全基因组测序数据获取和比对步骤,包括获取待测样本的低深度全基因组测序下机数据,去除接头,将其比对到参考基因组上,根据比对排序过滤PCR产生的重复序列,获得比对文件;全基因组测序数据质控步骤,包括对所述比对文件进行质量分析,获得包括比对率、测序深度、GC含量和重复率在内的质量信息,根据质量信息过滤获取合格的测序数据;污染数据过滤步骤,包括对测序数据进行污染率分析,分析其受污染情况,获取污染率小于污染率阈值的测序数据;拷贝数变异分析步骤,包括采用ACE软件确定低深度全基因组测序样本的肿瘤纯度,并且生成total CNA谱,所述total CNA谱包含样本名、染色体、起始位置、终止位置、拷贝数和segments片段信息;LST值计算步骤,包括根据所述total CNA谱计算样本的LST值,具体的,删除小于3M的segments片段,绘制segments片段密度分布图;取第一个局部最小值为CNA cutoff;若特定区间0.025到0.45之间不存在局部最小值,则将CNA cutoff设置为segments片段密度曲线第一个峰中出现的小拐点,通过降低CNA cutoff,使样本的LST增加;当相邻两个segments片段小于CNA cutoff,则将两个segments片段拟合;计算CNA cutoff的规则如下,若局部最小值大于0.025且小于0.45,取第一个局部最小值作为CNA cutoff;若局部最小值小于0.025时,取0.025作为CNA cutoff;若局部最小值大于0.45时,取0.45作为CNA cutoff;当局部最小值大于0.45时,且密度图在0.45之前出现导数值减小但未改变正负的小拐点时,计算0.025到0.45之间密度图的导数,导数的最小值对应的差值作为CNA cutoff;当相邻两个segments片段差值大于CNA cutoff,同时间隔小于3Mb,且长度均大于10Mb,则LST值加1;待测样本全基因组复制分析步骤,包括判断待测样本是否发生全基因组复制,如果有发生全基因组复制,并且样本segments片段极差大于2,同时segments片段密度图中峰值个数大于4,则LST值减9,作为最终的LST值;同源重组修复缺陷状态评估步骤,包括根据BRCA基因型别和最终的LST值判断同源重组修复缺陷状态为阳性或阴性。2.根据权利要求1所述的评估方法,其特征在于:所述全基因组测序数据获取和比对步骤中,所述低深度全基因组测序是指测序深度不超过5;优选的,采用bwa

mem2软件将去除接头的序列比对到参考基因组hg19上;优选的,所述全基因组测序数据质控步骤中,比对率大于95%,深度大于0.8为合格;优选的,所述污染数据过滤步骤中,所述污染率阈值为使用群体性等位基因频率构建模型评估样本的污染率;优选的,所述污染率阈值为0.1。3.根据权利要求1所述的评估方法,其特征在于:所述待测样本全基因组复制分析步骤中,判断待测样本是否发生全基因组复制的方法包括,根据segments片段密度分布图,通过segments片段的极差情况判断样本是否发生全基因组复制,判断规则包括,a.当样本segments片段极差小于1时,样本不发生全基因组复制;b.当样本segments片段极差大于1,且峰值个数小于3时,样本不发生全基因组复制;c.当样本segments片段极差大于1,且峰值...

【专利技术属性】
技术研发人员:黄毅朱彬彬陈华东刘久成刘青峰易鑫杨玲
申请(专利权)人:深圳吉因加医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1