The invention discloses a method for prediction of homologous recombination deficient mechanism and patient response to cancer treatment, relates to the field of bioinformatics prediction, according to the INDEL score, including the large fragment of copy number variation and mutation of tumor fraction of comprehensive value of one or more load fraction, judge whether there is tumor samples homologous recombination deficiency, among them, the comprehensive value may also include a heterozygous deletion mutation score. The invention realizes the large fragment of chromosome number, chromosome structure and gene type chromosome gene copy number and chromosomal variation interval and heterozygous deletion anomalies, and telomere unbalanced prediction, make the evaluation more perfect, able to accurately predict HRD, comprehensive utilization value can also determine whether patients of PARP inhibitors, DNA inhibitors, injury topoisomerase II/II+ inhibitors, topoisomerase I inhibitors, radiation therapy in one or more of the treatment response, simple method, wide universality.
【技术实现步骤摘要】
一种预测同源重组缺失机制及患者对癌症治疗响应的方法
本专利技术涉及生物信息领域,尤其涉及一种预测同源重组缺失机制及患者对癌症治疗响应的方法。
技术介绍
癌症的发展需要一系列的病变阶段,它的发展过程由基因变异所主导,包括DNA、RNA、蛋白质等多个层面的病变,其中DNA的改变是癌症发生的重要因素,包括单核苷酸变异(SingleNucleotidePolymorphism,SNP)、小的插入和缺失(SmallINDEL,INDEL为Insertion/Deletion的简称,长度通常小于50bp)、大的结构性变异等常见的变异形式。随着对癌症研究的不断深入,同源重组缺失(HomologousRecombinationDeficiency,HRD)机制在不同癌种当中的重要性不断被发现。超过50%的高级别浆液性卵巢癌患者存在明显的DNA修复基因缺失,20-25%前列腺癌存在BRCA1/BRCA2或其它同源重组通路中涉及的基因失活突变。DNA在复制过程中,正常细胞通过同源重组修复机制修复DNA双链断裂,从而保持正常的生长周期,而癌症细胞中由于同源重组(HomologousRecombination,HR)基因发生变异,从而发生同源重组缺失,导致DNA修复发生损伤,从而引起基因不平衡和肿瘤的无限增长。例如,BRCA1(BreastCancerType1,乳腺癌1号基因)或者BRCA2(BreastCancerType2,乳腺癌2号基因)突变的细胞,缺少野生基因型,从而导致DNA同源重组修复缺失,导致基因发生变异,从而导致癌症发生。DNA同源重组缺失在许多癌症临床中具有相 ...
【技术保护点】
一种预测同源重组缺失机制的方法,其特征在于,所述方法是根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失;其中,所述大片段INDEL分数、拷贝数变异分数以及肿瘤突变负荷分数是通过利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列得到的;其中,所述利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列包括以下步骤:对癌症相关的基因进行筛选,得到靶向基因库;根据靶向基因库的基因序列设计探针;将探针与肿瘤样本DNA和正常样本DNA分别进行杂交,得到目标区域范围内的肿瘤样本DNA片段和正常样本DNA片段,经建库和测序步骤,得到肿瘤样本基因序列和正常样本基因序列;其中,所述大片段INDEL分数值是根据肿瘤样本基因和正常样本基因序列序列统计得到;其中,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到;其中,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到。
【技术特征摘要】
1.一种预测同源重组缺失机制的方法,其特征在于,所述方法是根据包括大片段INDEL分数、拷贝数变异分数和肿瘤突变负荷分数中的一个或多个的综合值,判断肿瘤样本是否存在同源重组缺失;其中,所述大片段INDEL分数、拷贝数变异分数以及肿瘤突变负荷分数是通过利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列得到的;其中,所述利用癌症相关的靶向基因库设计的探针获得的肿瘤样本和正常样本的基因序列包括以下步骤:对癌症相关的基因进行筛选,得到靶向基因库;根据靶向基因库的基因序列设计探针;将探针与肿瘤样本DNA和正常样本DNA分别进行杂交,得到目标区域范围内的肿瘤样本DNA片段和正常样本DNA片段,经建库和测序步骤,得到肿瘤样本基因序列和正常样本基因序列;其中,所述大片段INDEL分数值是根据肿瘤样本基因和正常样本基因序列序列统计得到;其中,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到;其中,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到。2.如权利要求1所述的方法,其特征在于,所述综合值还包括杂合缺失变异分数;其中,所述杂合缺失变异分数值是通过对肿瘤样本目的基因序列进行变异重构统计获得的,包括杂合缺失区域分数值、端粒基因型不平衡区域分数值以及染色体大片段断裂区域值中的一种或多种。3.如权利要求1所述的方法,其特征在于,所述大片段INDEL分数值是根据肿瘤样本基因序列和正常样本基因序列统计得到包括:对肿瘤样本基因序列和正常样本基因序列分别进行筛选,去除碱基质量小于20的基因序列;对经过筛选的肿瘤样本基因序列和正常样本基因序列分别进行校正,使肿瘤样本基因序列和正常样本基因序列中的每一条序列均具有高频k-mer;将经过校正的肿瘤样本基因序列和正常样本基因序列分别进行组装,得到组装序列;将肿瘤样本组装序列和正常样本组装序列分别与参考序列进行比对,根据比对结果检测肿瘤样本和正常样本断点信息,剔除肿瘤样本包含的正常样本INDEL后,得到肿瘤样本中插入或缺失的大片段INDEL分数。4.如权利要求1所述的方法,其特征在于,所述拷贝数变异分数值是通过肿瘤样本基因序列和正常样本基因序列统计得到包括:将得到肿瘤样本基因序列和正常样本基因序列进行筛选,去除序列中的低质量测序序列及重复序列;将经过筛选的肿瘤样本基因序列和正常样本基因序列分别与人类参考基因组序列进行比对,得到肿瘤样本基因比对结果和正常样本基因比对结果;将所述肿瘤样本基因比对结果和正常样本基因比对结果作为输入,利用拷贝数变异软件进行拷贝数变异分析后,判断肿瘤样本发生扩增和缺失的区域,对发生扩增和缺失的区域进行统计,得到拷贝数变异分数。5.如权利要求1所述的方法,其特征在于,所述肿瘤突变负荷分数值是通过对正常样本基因序列和肿瘤样本基因序列进行单碱基水平变异分析得到包括:将预测的肿瘤样本基因序列单碱基水平变异进行基因注释;根据基因注释结果进行SNP筛选,得到去除已知的驱动突变位点、生殖细胞突变位点、COSMIC数据库中已知的体细胞突变SNP位点、dbSNP数据库中存在的生殖细胞突变SNP位点、同一位点出现多种变异碱基的生殖细胞突变位点的SNP筛选结果;计算SNP筛选结果中肿瘤样本基因序列发生突变的SNP个数总和以及癌症靶向基因库的编码基因区间大小,从而计算肿瘤突变负荷分数,计算单位为个/MB,公式如...
【专利技术属性】
技术研发人员:陈丽娟,王凯,秦公炜,
申请(专利权)人:上海至本生物科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。