构建乳腺癌新辅助化疗疗效分类模型的方法技术

技术编号:22818724 阅读:37 留言:0更新日期:2019-12-14 13:44
本发明专利技术公开了构建乳腺癌新辅助化疗疗效分类模型的方法,通过获取已知疗效病人的血浆cfDNA测序数据并进行TSSs区域覆盖度分析,确定覆盖度差异后进行聚类分析,得到分类模型。本发明专利技术方法构建的模型,可以实现对乳腺癌患者新辅助化疗进行疗效预测,确定乳腺癌的治疗策略,指导乳腺癌新辅助化疗。本发明专利技术的模型,所需要的数据来源于外周血,属于无创检测范畴,克服了现有乳腺癌新辅助化疗疗效预测的材料需要有创性穿刺取样所导致的临床体验不佳、无法解决肿瘤异质性、穿刺禁忌证、造成肿瘤传播转移风险等缺点。

The method of constructing the therapeutic effect classification model of neoadjuvant chemotherapy for breast cancer

【技术实现步骤摘要】
构建乳腺癌新辅助化疗疗效分类模型的方法
本专利技术涉及一种分类模型的构建方法及试剂盒,特别涉及利用血浆cfDNA中TSSs区域构建乳腺癌新辅助化疗疗效分类模型的方法。
技术介绍
新辅助化疗(neoadjuvantchemotherapy,NACT)目前应用于局部晚期乳腺癌患者,或者有辅助化疗指征及强烈保乳需求的患者中。主要有以下4方面优势:首先,它可以使不可切除的肿瘤变为可切除;其次,增加保乳的机会;对于局部晚期并远处转移风险的患者,术前全身治疗被期望可以改善患者的生存时间;可以观察到肿瘤的缩小和成像变化,并且能够对临床疗效进行快速评价。因此新辅助化疗的使用可以明显减小手术前肿瘤的大小,降低临床分期,以及减少腋窝淋巴结的累及,避免乳房全切除,有助于提高患者的生活质量。新辅助化疗的反应通常以病理完全反应(pCR)来评价,即在最终手术时,原发肿瘤床和局部淋巴结均无浸润性乳腺癌组织。pCR的结果与总体生存率和无病生存率的提高密切相关。新辅助化疗对于HER2阳性和三阴性乳腺癌来说反应率较高,HER2阳性中达到pCR的比例可以高达30%-60%以上,三阴性乳腺癌也可以高达20%-30%。对于ER阳性的病人来说,luminalA型的患者pCR率只有5%左右,而且pCR率与远期预后关系不大。对于luminalB型患者,在中国占乳腺癌患者大部分,在新辅助化疗后至少一半以上病人都可以达到肿瘤体积明显缩小,但仍有少数侵袭性细胞,且预后也明显改善,所以对于luminalB型的新辅助化疗可以用来缩瘤降期,而不以pCR做为新辅助治疗的目的。根据实体瘤疗效评价标准RECIST1.0可以分为四类:CR(所有病灶消失维持4周),PR(缩小30%,维持4周),SD(非PR/PD)和PD(增加20%,病灶增加前非CR/PR/SD)。虽然新辅助化疗在过去的30多年取得了较大进展,但仍有20-30%的患者对新辅助化疗方案敏感性不佳,导致了病情延误,错过最佳治疗时机以及过度治疗。因此根据敏感性预测指标来制定乳腺癌个体化治疗方案是非常重要的,也可以避免治疗的盲目性。传统的辅助化疗疗效预测方案主要是针对ER阳性、淋巴结未发生转移的早期乳腺癌患者的21基因复发风险评估,2019年NCCN、ASCO和CSCO的乳腺癌指南中又新增加了70基因表达谱检测,主要针对ER或者PR阳性,Her-2阴性的乳腺癌患者,同时范围增加到对腋窝淋巴结有1-3个转移患者,这些检测对于早期乳腺癌患者的治疗决策,评估早期浸润性乳腺癌患者5年内的远处转移风险,使一部分乳腺癌患者在不影响长期疗效的基础上避免接受辅助化疗具有显著的意义。而目前针对预测乳腺癌新辅助化疗疗效尚无标准,可能的方案是应用新辅助化疗前的癌组织穿刺标本进行21基因复发风险评估或70基因表达谱检测,进而实现疗效预测及方案的确定。但由于穿刺的组织标本具有肿瘤异质性,样本量少等特点限制了其临床应用。而在过去的几年中,液体活检越来越多应用于癌症的早期诊断,预后预测,复发风险评估,连续采样监测疾病进展和治疗反应等方向。相对于传统的组织活检,液态活检具有无创性、均质化及连续采样等优势。目前用于监测乳腺癌的标志物有肿瘤抗原15-3和27-29,但它们的敏感性估计仅为60-70%。除此之外患者血浆中循环肿瘤DNA(ctDNA),循环肿瘤细胞(CTCs)和外泌体(Exosome)等的检出率和预后价值关系较大。其中ctDNA中的FGFR、ErBB2(HER2)、ErBB3(HER3)、PI3K、BRCA1/2等基因突变为转移性乳腺癌的治疗策略提供参考。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种构建乳腺癌新辅助化疗疗效分类模型的方法。本专利技术所采取的技术方案是:专利技术人研究发现,细胞游离DNA(cfDNA)主要来自于凋亡细胞,cfDNA因被核小体保护而未被降解。基因组的核小体印记与基因转录水平密切相关,尤其在基因表达的转录起始位点(TSSs)附近区域核小体的结合明显减少。因此本专利技术利用血浆中cfDNA的全基因组测序,分析TSSs区域覆盖度差异,构建一种用于预测乳腺癌新辅助化疗疗效的分类模型,为乳腺癌的治疗提供更为广阔和可靠的数据来源,具有更大的前景。一种构建乳腺癌新辅助化疗疗效分类模型的方法,包括如下步骤:cfDNA的reads的获取:获取已知化疗结果的不同乳腺癌分型病人的血浆cfDNA测序数据,获得cfDNA的reads数据;TSSs区域覆盖度分析:提取基因转录起始位点TSSs上下游区域的基因组位置信息,定义为原始启动子区域;将cfDNA的reads比对到人类参考基因组hg19上,去除比对数据中的重复序列,统计出所有蛋白编码基因的原始启动子区域的reads数后,对TSSs区域覆盖度进行标准化处理;覆盖度差异分析:利用Kruskal-Wallis非参数单因子方差分析方法,筛选出各组中TSSs区域覆盖度存在差异的基因启动子区域,对原始P值进行校正,筛选出FDR值小于0.1的基因启动子区域,最后确定差异TSSs区域;聚类分析:对TSSs区域覆盖度的数据进行样本间的标准化,采用等级聚类法根据样本间启动子覆盖度的相关性进行聚类分析;根据原始启动子区域的覆盖度差异和所述病人的已知疗效情况,将样本类型聚类为pCR组和npCR组或PR组和SD组,得到乳腺癌新辅助化疗疗效分类模型。在一些方法的实例中,所述原始启动子区域为基因转录起始位点TSSs上下游1Kb的区域。在一些方法的实例中,每个样本的所述cfDNA测序数据量不少于6M。在一些方法的实例中,所述乳腺癌分型包括luminalB型、Her-2阳性和三阴性。在一些方法的实例中,所述化疗使用的药物包括表柔比星、环磷酰胺、紫杉醇、卡铂、吉西他滨、卡培他滨中的至少一种。在一些方法的实例中,对聚类分析数据进行可视化处理。在一些方法的实例中,所述可视化处理的软件为Treeview软件或者R语言heatmap函数。在一些方法的实例中,TSSs区域覆盖度分析时,所述标准化处理的方法选自RPKM标准化方法、FPKM标准化方法或按如下方法计算得到:标准化数值=区域reads数目/总比对上的reads数目。在一些方法的实例中,覆盖度差异分析时,使用holm法对原始P值进行校正。在一些方法的实例中,使用Z-score标准化方法对基因启动子覆盖度的数据进行样本间的标准化,其计算公式为:标准后数值式中x为原始数值,μ为样本均值,σ为样本方差。本专利技术的有益效果是:本专利技术方法构建的模型,通过对待测病人的血浆cfDNA序列可以实现对乳腺癌患者新辅助化疗进行疗效预测,确定乳腺癌的治疗策略,指导乳腺癌新辅助化疗。本专利技术的模型,所需要的数据来源于外周血,属于无创检测范畴,克服了现有乳腺癌新辅助化疗疗效预测的材料需要有创性穿刺取样所导致的临床体验不佳、无法解决肿瘤异质性、穿刺禁忌证、造成肿瘤传播转移风险等缺点。附图说明本文档来自技高网
...

【技术保护点】
1.一种构建乳腺癌新辅助化疗疗效分类模型的方法,包括如下步骤:/ncfDNA的reads的获取:/n获取已知化疗结果的不同乳腺癌分型病人的血浆cfDNA测序数据,获得cfDNA的reads数据;/nTSSs区域覆盖度分析:/n提取基因转录起始位点TSSs上下游区域的基因组位置信息,定义为原始启动子区域;/n将cfDNA的reads比对到人类参考基因组hg19上,去除比对数据中的重复序列,统计出所有蛋白编码基因的原始启动子区域的reads数后,对TSSs区域覆盖度进行标准化处理;/n覆盖度差异分析:/n利用Kruskal-Wallis非参数单因子方差分析方法,筛选出各组中TSSs区域覆盖度存在差异的基因启动子区域,对原始P值进行校正,筛选出FDR值小于0.1的基因启动子区域,最后确定差异TSSs区域;/n聚类分析:/n对TSSs区域覆盖度的数据进行样本间的标准化,采用等级聚类法根据样本间启动子覆盖度的相关性进行聚类分析;根据原始启动子区域的覆盖度差异和所述病人的已知疗效情况,将样本类型聚类为pCR组和npCR组或PR组和SD组,得到乳腺癌新辅助化疗疗效分类模型。/n

【技术特征摘要】
1.一种构建乳腺癌新辅助化疗疗效分类模型的方法,包括如下步骤:
cfDNA的reads的获取:
获取已知化疗结果的不同乳腺癌分型病人的血浆cfDNA测序数据,获得cfDNA的reads数据;
TSSs区域覆盖度分析:
提取基因转录起始位点TSSs上下游区域的基因组位置信息,定义为原始启动子区域;
将cfDNA的reads比对到人类参考基因组hg19上,去除比对数据中的重复序列,统计出所有蛋白编码基因的原始启动子区域的reads数后,对TSSs区域覆盖度进行标准化处理;
覆盖度差异分析:
利用Kruskal-Wallis非参数单因子方差分析方法,筛选出各组中TSSs区域覆盖度存在差异的基因启动子区域,对原始P值进行校正,筛选出FDR值小于0.1的基因启动子区域,最后确定差异TSSs区域;
聚类分析:
对TSSs区域覆盖度的数据进行样本间的标准化,采用等级聚类法根据样本间启动子覆盖度的相关性进行聚类分析;根据原始启动子区域的覆盖度差异和所述病人的已知疗效情况,将样本类型聚类为pCR组和npCR组或PR组和SD组,得到乳腺癌新辅助化疗疗效分类模型。


2.根据权利要求1所述的方法,其特征在于:所述原始启动子区域为基因转录起始位点TSSs上下游1Kb的区域。


3.根据权...

【专利技术属性】
技术研发人员:胥顺李坤杨学习
申请(专利权)人:广州市雄基生物信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利