基于基因表达量预测肝细胞癌治疗反应性模型的构建方法技术

技术编号:34842790 阅读:13 留言:0更新日期:2022-09-08 07:40
本发明专利技术公开基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,包括以下步骤:根据公开数据库中若干名肝细胞癌患者肿瘤组织样本中基因芯片检测的相应基因的表达量;构建肝细胞癌TACE治疗反应性的预测模型;将肝细胞癌患者的肿瘤组织样本随机分为训练集和验证集,在训练集中,根据患者对TACE治疗的反应性分为反应及不反应两组,利用差异表达基因的方法找出与响应相关的基因,再通过多轮支持向量机建模确定最终纳入模型的基因及其相应权重系数;将得到的模型在外部验证集中对患者的总体生存时间差异进行统计学分析和比较,并评估预测模型的性能。本发明专利技术有选择性地通过基因的表达量对样本进行区分,能更为准确地预测患者对TACE治疗的反应。对TACE治疗的反应。对TACE治疗的反应。

【技术实现步骤摘要】
基于基因表达量预测肝细胞癌治疗反应性模型的构建方法


[0001]本专利技术涉及医疗
,具体涉及基于基因表达量预测肝细胞癌治疗反应性模型的构建方法。

技术介绍

[0002]经动脉化疗栓塞术(Transarterial Chemoembolization, TACE)是目前被公认的肝癌非手术治疗的最常用方法,广泛应用于中国肝癌分期中Ⅱb
‑Ⅲ
a期的病人。其通过将导管选择性置入到肿瘤的供血靶动脉后,向其中注入化疗药物及栓塞剂或载药微球达到化疗性栓塞的作用。由于中期肝癌的异质性以及TACE术的广泛的超范围应用,病人对TACE的反应及其有效率差异较大。因此筛选出对TACE术反应较好的病人接受适当的治疗便显得尤其重要。
[0003]现行的多个预测TACE术后效果的打分系统主要依赖于临床常规测量的指标进行评估,正是由于现有的对TACE反应性的预测更多依赖于临床上易获取的指标,虽然更简单易行,但预测的准确度大打折扣,简单方便的同时也损害了信度和效度。此外,现行指标大多是肝癌特异性,而非TACE特异性。
[0004]为此,我们提出基因表达量预测肝细胞癌治疗反应性模型的构建方法用于解决上述存在的问题。

技术实现思路

[0005]本专利技术提供一种基于基因表达量预测肝细胞癌治疗反应性模型的构建方法用于解决上述
技术介绍
中存在的至少一个问题。
[0006]基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,包括以下步骤:步骤一:获取GSE104580数据库中经动脉化疗栓塞术(TACE)术前穿刺活检得到的肝细胞癌患者的肿瘤组织样本,对样本行基因芯片测序检测的转录组的表达水平量;步骤二:将肝细胞癌患者的肿瘤组织样本随机分为训练集和验证集,在训练集中,根据患者对TACE治疗的反应性分为反应组与不反应组,通过差异表达基因方法鉴定出与反应性相关的基因,再通过LASSO(Least Absolμte Shrinkage and Selection Operator)

logistic回归、随机森林、xgboost

随机森林、多层感知网络、支持向量机5种建模方式进行模型构建,确定通过ROC曲线比较各个模型并最终确定以10个基因表达为基础的支持向量机模型及其相应权重系数;步骤三:以风险评分的中位数为阈值将患者分为TACE反应型组或TACE不反应型组,对两组患者的TACE疗效差异进行统计学分析和比较,并评估和确定肝细胞癌TACE治疗反应性的最佳预测模型。
[0007]作为优选方案,相关的所述10个基因分别为AQP1、FABP4、HERC6、 LOX、PEG10、 S100A8、 SPARCL1、 TIAM1、 TSPAN8以及 TYRO3。
[0008]作为优选方案,在步骤三中,所述风险评分的计算公式为X=A1*B1+A2*B2+

+
A10*B10,其中B1、B2、

、B10分别为纳入模型的10个基因的表达水平,A1、A2、

、A10分别为LASSO回归计算得到的10个基因的权重系数。
[0009]作为优选方案,所述的基于基因表达量预测肝细胞癌治疗反应性模型的构建方法还包括步骤四:在外部验证集中检验上述肝细胞癌TACE治疗反应性的预测模型的预测能力。
[0010]作为优选方案,在步骤四中,用相同的计算公式计算验证集中每个样本的风险评分。
[0011]作为优选方案,计算验证集中每个样本的风险评分后,以训练集中的风险评分中位数为界值将患者分为TACE反应型组或TACE不反应型组,分析两组间术后总体生存时间有无统计学差异。
[0012]作为优选方案,在步骤四中,所述肝细胞癌患者的肿瘤组织样本不少于100份。
[0013]作为优选方案,在步骤三和四中,评估肝细胞癌TACE治疗反应性的预测模型的性能的步骤为:通过多因素COX比例风险回归分析和ROC(Receiver Operating Characteristic)曲线评估构建的肝细胞癌TACE治疗反应性的预测模型的性能。
[0014]有益效果:本专利技术从医学的角度出发,有选择性地通过10个基因的表达量对样本进行区分,能更为准确地预测患者对TACE治疗的反应,指导患者的下一步治疗,利用TACE特异性解决了由于现有的对TACE反应性的预测更多依赖于临床上易获取的指标而导致预测的准确度大打折扣的问题,增加了信度和效度。
附图说明
[0015]图1为本专利技术的方法步骤图。
具体实施方式
[0016]现在结合附图对本专利技术作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本专利技术的基本结构,因此其仅显示与本专利技术有关的构成。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0017]如图1所示,本专利技术提供一种基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,包括以下步骤:基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,包括以下步骤:步骤一:获取GSE104580数据库中经动脉化疗栓塞术(TACE)术前穿刺活检得到的肝细胞癌患者的肿瘤组织样本,对样本行基因芯片测序检测的转录组的表达水平量;步骤二:将肝细胞癌患者的肿瘤组织样本随机分为训练集和验证集,在训练集中,根据患者对TACE治疗的反应性分为反应组与不反应组,通过差异表达基因方法鉴定出与反应性相关的基因,再通过LASSO(Least Absolμte Shrinkage and Selection Operator)

logistic回归、随机森林、xgboost

随机森林、多层感知网络、支持向量机5种建模方式进行模型构建,确定通过ROC曲线比较各个模型并最终确定以10个基因表达为基础的支持向量机模型及其相应权重系数;相关的所述10个基因分别为AQP1、FABP4、HERC6、 LOX、PEG10、 S100A8、 SPARCL1、 TIAM1、 TSPAN8以及 TYRO3;
步骤三:以风险评分的中位数为阈值将患者分为TACE反应型组或TACE不反应型组,对两组患者的TACE疗效差异进行统计学分析和比较,并评估和确定肝细胞癌TACE治疗反应性的最佳预测模型;在步骤三中,所述风险评分的计算公式为X=A1*B1+A2*B2+

+A10*B10,其中B1、B2、

、B10分别为纳入模型的10个基因的表达水平,A1、A2、

、A10分别为LASSO回归计算得到的10个基因的权重系数。
[0018]步骤四:在外部验证集中检验上述肝细胞癌TACE治疗反应性的预测模型的预测能力;用相同的计算公式计算验证集中每个样本的风险评分;计算验证集中每个样本的风险评分后,以训练集中的风险评分中位数为界值将患者分为TACE反应型组或TACE不反应型组,分析两组间术后总体生存时间有无统计学差异;所述肝细胞癌患者的肿瘤组织本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,其特征在于,包括以下步骤:步骤一:获取GSE104580数据库中经动脉化疗栓塞术(TACE)术前穿刺活检得到的肝细胞癌患者的肿瘤组织样本,对样本行基因芯片测序检测的转录组的表达水平量;步骤二:将肝细胞癌患者的肿瘤组织样本随机分为训练集和验证集,在训练集中,根据患者对TACE治疗的反应性分为反应组与不反应组,通过差异表达基因方法鉴定出与反应性相关的基因,再通过LASSO(Least Absolμte Shrinkage and Selection Operator)

logistic回归、随机森林、xgboost

随机森林、多层感知网络、支持向量机5种建模方式进行模型构建,确定通过ROC曲线比较各个模型并最终确定以10个基因表达为基础的支持向量机模型及其相应权重系数;步骤三:以风险评分的中位数为阈值将患者分为TACE反应型组或TACE不反应型组,对两组患者的TACE疗效差异进行统计学分析和比较,并评估和确定肝细胞癌TACE治疗反应性的最佳预测模型。2.根据权利要求1所述的基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,其特征在于,相关的所述10个基因分别为AQP1、FABP4、HERC6、 LOX、PEG10、 S100A8、 SPARCL1、 TIAM1、 TSPAN8以及 TYRO3。3.根据权利要求2所述的基于基因表达量预测肝细胞癌治疗反应性模型的构建方法,其特征在于,在步骤三中,所述风险评分的...

【专利技术属性】
技术研发人员:李家平唐熠阳
申请(专利权)人:中山大学附属第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1