一种预测同源重组缺失机制及患者对癌症治疗响应的方法技术

技术编号:16450759 阅读:18 留言:0更新日期:2017-10-25 14:45
本发明专利技术公开一种预测同源重组缺失机制及患者对癌症治疗响应的方法,涉及生物信息预测领域,其根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失,其中,所述综合值还可以包括杂合缺失变异分数。本发明专利技术实现了染色体大片段结构、染色体基因型数目、染色体基因拷贝数、染色体变异间隔和杂合缺失异常,以及染色体端粒不平衡预测,使评估范围更加完善,能够准确地预测HRD,利用综合值还可以确定患者是否对包含PARP抑制剂、DNA损伤抑制剂、拓扑异构酶II/II+抑制剂、拓扑异构酶I抑制剂、放射治疗中的一种或多种的治疗方案发生响应,方法简单,普适性广。

A mechanism for predicting the deletion of homologous recombination and the response of patients to cancer therapy

The invention discloses a method for prediction of homologous recombination deficient mechanism and patient response to cancer treatment, relates to the field of bioinformatics prediction, according to the INDEL score, including the large fragment of copy number variation and mutation of tumor fraction of comprehensive value of one or more load fraction, judge whether there is tumor samples homologous recombination deficiency, among them, the comprehensive value may also include a heterozygous deletion mutation score. The invention realizes the large fragment of chromosome number, chromosome structure and gene type chromosome gene copy number and chromosomal variation interval and heterozygous deletion anomalies, and telomere unbalanced prediction, make the evaluation more perfect, able to accurately predict HRD, comprehensive utilization value can also determine whether patients of PARP inhibitors, DNA inhibitors, injury topoisomerase II/II+ inhibitors, topoisomerase I inhibitors, radiation therapy in one or more of the treatment response, simple method, wide universality.

【技术实现步骤摘要】
一种预测同源重组缺失机制及患者对癌症治疗响应的方法
本专利技术涉及生物信息领域,尤其涉及一种预测同源重组缺失机制及患者对癌症治疗响应的方法。
技术介绍
癌症的发展需要一系列的病变阶段,它的发展过程由基因变异所主导,包括DNA、RNA、蛋白质等多个层面的病变,其中DNA的改变是癌症发生的重要因素,包括单核苷酸变异(SingleNucleotidePolymorphism,SNP)、小的插入和缺失(SmallINDEL,INDEL为Insertion/Deletion的简称,长度通常小于50bp)、大的结构性变异等常见的变异形式。随着对癌症研究的不断深入,同源重组缺失(HomologousRecombinationDeficiency,HRD)机制在不同癌种当中的重要性不断被发现。超过50%的高级别浆液性卵巢癌患者存在明显的DNA修复基因缺失,20-25%前列腺癌存在BRCA1/BRCA2或其它同源重组通路中涉及的基因失活突变。DNA在复制过程中,正常细胞通过同源重组修复机制修复DNA双链断裂,从而保持正常的生长周期,而癌症细胞中由于同源重组(HomologousRecombination,HR)基因发生变异,从而发生同源重组缺失,导致DNA修复发生损伤,从而引起基因不平衡和肿瘤的无限增长。例如,BRCA1(BreastCancerType1,乳腺癌1号基因)或者BRCA2(BreastCancerType2,乳腺癌2号基因)突变的细胞,缺少野生基因型,从而导致DNA同源重组修复缺失,导致基因发生变异,从而导致癌症发生。DNA同源重组缺失在许多癌症临床中具有相关性,特别是乳腺癌和卵巢。基于所呈现的DNA修复缺失类型,对于特定的DNA损害物质或者靶向物质,癌症可能表现出增长的敏感性,比如铂类或者PRAP阻断剂(PolyADP-ribosepolymeraseinhibitor,PARPi)。PARPs(PolyADP-ribosepolymerases)是DNA修复过程中蛋白修饰的一类酶,其中一些类型可以通过单碱基修复来修补DNA的单链缺失,例如PARP1(PolyADP-ribosepolymerase1)。通常这些单碱基缺失在复制时可以导致双链上的碱基缺失,而在正常情况下这些情况下可以由同源重组通路中的基因修复,如BRCA1和BRCA2,而不能正常修复的细胞就会发生癌症。PARP阻断剂可以检测到这种缺失,从而使癌症细胞发生毒性,最终走向死亡。BRCA1和BRCA2是与遗传性乳腺癌有关的基因,显示有BRCA1基因突变者患乳腺癌和卵巢癌的风险分别是40%~85%和25%~65%,有BRCA2基因突变者患乳腺癌和卵巢癌的风险分别是40%~85%和15%~20%。这两个基因在同源重组途径和范可尼贫血通路中是非常重要的基因,如果发生突变,则会DNA修复发生缺失,包括同源重组缺失。研究证明,这两个基因发生突变时,这种药物敏感性表现尤为明显。例如,对具有BRCA1和BRCA2突变的病人进行铂类物质或者PARP阻断剂的用药,发现可以得到更好的治疗效果。然而,很多肿瘤并没有明显的BRCA1/BRCA2的突变表征,但具有与BRCA1/2突变的癌症相似的基因表征,也表现出对铂类物质的治疗敏感性。因此,同源重组基因缺失,不仅仅是BRCA1/2缺失,都可能表现出与BRCA1/2缺失相似的药物敏感性。该现象的发现非常具有临床意义,例如,三阴性乳腺癌(TripleNegativeBreastCancer,TNBC),即雌激素受体(EstrogenReceptor,ER)、孕激素受体(ProgesteroneReceptor,PR)和原癌基因Her-2均为阴性的乳腺癌。这类乳腺癌占所有乳腺癌病理类型的20%~25%,比其它乳腺癌更具有侵袭性,治疗无很好的愈后。由于缺乏合适的药物治疗靶点,只能进行化疗,而采用哪种化疗物质来进行治疗,是TNBC治疗的一个重大课题。因此,亟待一种基于DNA同源重组缺失(HRD)机制的可靠生物标记,在DNA修复途径层面的基因特征而非基因层次的基因特征,有效地区分病人,针对地使患者接受特定的抗癌治疗,避免接受不必要的毒性损伤。目前关于HRD研究主要是通过单独计算杂合缺失(LossofHeterozygosity,LOH)的数目,端粒基因型不平衡(TelomericAllellicImbalance,TAI)的数目和大范围的结构转移(Large-scaleStateTransition,LST)的数目中的一个、两个或三个的值进行,例如申请号为201280070358.0的专利文件仅通过一个值即LOH缺失去评估HRD,又例如,申请号为WO2014165785的专利文件利用三个值的组合去评估HRD,并没有考虑到其它重要类型变异导致同源重组缺失发生的情况。研究表明,不仅LOH可以影响BRCA1/BRCA2调节的DNA操作修复代谢途径或者其它修复相关的代谢途径,还有其它变异类型可以影响到DNA损伤修复,例如INDEL(插入和缺失)、CNV(CopyNumberVariation,拷贝数变异)、TMB(TumorMutationalBurden,肿瘤突变负荷)等,这些变异类型与染色体损伤之间存在相关,从而影响着机体能否成功修复DNA损伤。特别是,同源重组相关代谢途径中的基因发生此类型变异时,会使同源重组机制缺失,例如TP53(TumorSuppressorGene,肿瘤抑制基因),BRCA2(BreastCancerType2,乳腺癌2号基因),RET(RearrangedDuringTransfection,原致癌基因),RB1(RetinoblastomaGene,视网膜母细胞瘤基因)等基因的拷贝数变异,以及PTEN基因的缺失等等。因此,目前已知算法的计算类型较为固定,不能对同源重组缺失进行更多染色体变异类型的预测。而且,随着高通量测序技术的不断发展和更新,目前研究或应用主要的技术为新一代测序技术,而目前的HRD预测技术主要基于SNP芯片技术,存在数据生产平台与算法预测机制不匹配的技术问题,例如现有技术平台多采用SNP芯片的技术,算法预测所采用的主要是芯片平台仪器自身所产生的数据值来直接进行计算,而测序技术却没有相应的数据值,需要新的计算方式,因此其局限性较大。
技术实现思路
针对现有技术中存在的染色体变异检测类型少、基因检测范围较为局限,且测序技术与测序平台不匹配的技术问题,本专利技术提供一种可以同时检测拷贝数变异、杂合缺失变异、大片段INDEL变异、肿瘤突变负荷的同源重组缺失预测方法,该方法不但可以进行大片段INDEL变异的预测,还克服了现有技术中只能检测插入片段在25bp以内和缺失片段在50bp以内的小片段变异的技术问题,本专利技术方法预测准确,操作简单。为实现本专利技术的技术目的,本专利技术提供一种预测同源重组缺失机制的方法,所述方法是根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失;其中,所述大片段INDEL分数、拷贝数变异分数以及肿瘤突变负荷分数是通过利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列得到的;其中,所述利用癌症相关本文档来自技高网
...

【技术保护点】
一种预测同源重组缺失机制的方法,其特征在于,所述方法是根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失;其中,所述大片段INDEL分数、拷贝数变异分数以及肿瘤突变负荷分数是通过利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列得到的;其中,所述利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列包括以下步骤:对癌症相关的基因进行筛选,得到靶向基因库;根据靶向基因库的基因序列设计探针;将探针与肿瘤样本DNA和正常样本DNA分别进行杂交,得到目标区域范围内的肿瘤样本DNA片段和正常样本DNA片段,经建库和测序步骤,得到肿瘤样本基因序列和正常样本基因序列;其中,所述大片段INDEL分数值是根据肿瘤样本基因和正常样本基因序列序列统计得到;其中,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到;其中,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到。

【技术特征摘要】
1.一种预测同源重组缺失机制的方法,其特征在于,所述方法是根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失;其中,所述大片段INDEL分数、拷贝数变异分数以及肿瘤突变负荷分数是通过利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列得到的;其中,所述利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列包括以下步骤:对癌症相关的基因进行筛选,得到靶向基因库;根据靶向基因库的基因序列设计探针;将探针与肿瘤样本DNA和正常样本DNA分别进行杂交,得到目标区域范围内的肿瘤样本DNA片段和正常样本DNA片段,经建库和测序步骤,得到肿瘤样本基因序列和正常样本基因序列;其中,所述大片段INDEL分数值是根据肿瘤样本基因和正常样本基因序列序列统计得到;其中,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到;其中,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到。2.如权利要求1所述的方法,其特征在于,所述综合值还包括杂合缺失变异分数;其中,所述杂合缺失变异分数值是通过对肿瘤样本目的基因序列进行变异重构统计获得的,包括杂合缺失区域分数值、端粒基因型不平衡区域分数值以及染色体大片段断裂区域值中的一种或多种。3.如权利要求1所述的方法,其特征在于,所述大片段INDEL分数值是根据肿瘤样本基因序列和正常样本基因序列统计得到包括:对肿瘤样本基因序列和正常样本基因序列分别进行筛选,去除碱基质量小于20的基因序列;对经过筛选的肿瘤样本基因序列和正常样本基因序列分别进行校正,使肿瘤样本基因序列和正常样本基因序列中的每一条序列均具有高频k-mer;将经过校正的肿瘤样本基因序列和正常样本基因序列分别进行组装,得到组装序列;将肿瘤样本组装序列和正常样本组装序列分别与参考序列进行比对,根据比对结果检测肿瘤样本和正常样本断点信息,剔除肿瘤样本包含的正常样本INDEL后,得到肿瘤样本中插入或缺失的大片段INDEL分数。4.如权利要求1所述的方法,其特征在于,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到包括:将得到肿瘤样本基因序列和正常样本基因序列进行筛选,去除序列中的低质量测序序列及重复序列;将经过筛选的肿瘤样本基因序列和正常样本基因序列分别与人类参考基因组序列进行比对,得到肿瘤样本基因比对结果和正常样本基因比对结果;将所述肿瘤样本基因比对结果和正常样本基因比对结果作为输入,利用拷贝数变异软件进行拷贝数变异分析后,判断肿瘤样本发生扩增和缺失的区域,对发生扩增和缺失的区域进行统计,得到拷贝数变异分数。5.如权利要求1所述的方法,其特征在于,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到包括:将预测的肿瘤样本基因序列单碱基水平变异进行基因注释;根据基因注释结果进行SNP筛选,得到去除已知的驱动突变位点、生殖细胞突变位点、COSMIC数据库中已知的体细胞突变SNP位点、dbSNP数据库中存在的生殖细胞突变SNP位点、同一位点出现多种变异碱基的生殖细胞突变位点的SNP筛选结果;计算SNP筛选结果中肿瘤样本基因序列发生突变的SNP个数总和以及癌症靶向基因库的编码基因区间大小,从而计算肿瘤突变负荷分数,计算单位为个/MB,公式如...

【专利技术属性】
技术研发人员:陈丽娟王凯秦公炜
申请(专利权)人:上海至本生物科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1