一种肺腺癌预后模型制造技术

技术编号:38008599 阅读:11 留言:0更新日期:2023-06-30 10:27
本发明专利技术公开了一种肺腺癌预后模型,属于肿瘤分子生物学技术领域,所述肺腺癌预后模型基于多胺代谢相关基因SMS、SMOX、GPC1、SLC47A1、AZIN2和MAOB的组合进行构建;构建方法为:从癌症基因组图谱数据库和基因表达综合数据库中收集构建多胺代谢相关基因肺腺癌预后模型的训练集和验证集;从KEGG、GO数据库和文献中整理多胺代谢相关基因;通过LASSO

【技术实现步骤摘要】
一种肺腺癌预后模型


[0001]本专利技术涉及肿瘤分子生物学
,尤其涉及一种肺腺癌预后模型。

技术介绍

[0002]肺癌是全球死亡率最高的癌症,5年生存率约为16.6%。肺腺癌是肺癌最常见的组织学表现。近年来,肺腺癌发展为多种治疗方法,如手术切除、化疗、放疗、分子靶向治疗及免疫治疗等,但肺腺癌患者的总体生存时间并没有明显改善,主要原因是缺乏有用的分子生物标志物。因此,鉴定肺腺癌生物标志物,提高对肺腺癌分子机制的了解,开发新的治疗策略对改善患者预后十分必要。
[0003]多胺(腐胺、亚精胺和精胺)是广泛存在于真核生物的一类低分子脂肪族阳离子化合物,是真核生物生长和存活的必需物质。细胞内多胺水平受到多胺生物合成、分解代谢和转运的严格控制和调节。在癌症中,多胺代谢经常失调,而多胺水平异常升高是肿瘤转化和进展的重要条件。近年来,越来越多研究报道多胺代谢基因表达量(如SMS、SMOX和AZIN2)可作为癌症患者的预后参数,然而,关于多胺代谢相关基因组合的潜在预后作用尚未被探讨。

技术实现思路

[0004]本专利技术的目的,就在于提供一种肺腺癌预后模型,以解决上述问题。
[0005]为了实现上述目的,本专利技术采用的技术方案是这样的:一种肺腺癌预后模型,所述肺腺癌预后模型基于六种多胺代谢相关基因进行构建,所述六种多胺代谢相关基因为SMS、SMOX、GPC1、SLC47A1、AZIN2和MAOB,
[0006]其构建方法为,包括下述步骤:
[0007](1)从癌症基因组图谱数据库和基因表达综合数据库中收集构建多胺代谢相关基因肺腺癌预后模型的训练集和验证集;
[0008](2)从KEGG、GO数据库和文献中整理多胺代谢相关基因;
[0009](3)通过LASSO

COX回归构建多胺代谢相关基因的预后模型,具体构建方法为:使用R包“glmnet”在训练集中建立LASSO

COX回归模型;用bootstrap法进行惩罚最大似然估计,重复1000次;由偏似然偏差最小值确定最优正则化参数λ,再以该λ值确定最佳基因数目及回归系数,预后模型的计算方法为:
[0010]风险评分= ;
[0011]其中,n表示为基因总量,exp
i
表示为基因i的表达量,cor
i
表示为基因i在回归分析中的回归系数。
[0012]与现有技术相比,本专利技术的优点在于:本专利技术中,通过多个独立数据验证,结果表明,SMS、SMOX、AZIN2单基因模型一致性指数(C

index)中位值分别为0.55、0.59、0.57,而多胺代谢相关基因组合预后模型的C

index为0.63(表1),相较于现有的单基因模型,本专利技术的多胺代谢相关基因组合预后模型C

index提高约10.5%,取得了协同增效的效果,而多胺
Tumors Reveals Prognostic and Immunotherapeutic Implications of Polyamine Metabolism[J]. Cancer Res Commun. 2022,2(7):639

652”,整理出多胺代谢相关基因;
[0033]3)多胺代谢相关基因预后模型的构建
[0034]根据整理的多胺代谢相关基因,使用R包“glmnet”在训练集中建立LASSO

COX回归模型;用bootstrap法进行了惩罚最大似然估计,重复1000次;由偏似然偏差最小值确定最优正则化参数λ,再以该λ值确定最佳基因数目及回归系数,预后模型的计算方法为:
[0035]风险评分= [0036]其中,n表示为基因总量,exp
i
表示为基因i的表达量,cor
i
表示为基因i在回归分析中的回归系数;根据中位风险评分将LUAD患者分为低风险组和高风险组,并使用Kaplan

Meier分析比较两组之前总生存率(OS);R包“survival”、“survminer”、“timeROC”用于1、3和5年的受试者工作特征(ROC)曲线图和去线下面积(AUC)计算;将临床病理特征(性别、年龄、分期)和风险评分纳入多因素COX回归分析,以验证预后模型的风险评分是否可以作为预测总体生存结果的独立危险因素;使用来自GEO数据库的LUAD队列(GSE3141、GSE31210、GSE41271、GSE42127和GSE50081)进行验证,并通过与上述相同的方法计算风险评分,将队列分为2个亚组(低风险组和高风险组);
[0037]LASSO

COX回归模型中,随着λ值取值增大基因的回归系数逐渐收缩,当回归系数为零时该基因将被排除(图2)。根据1000次bootstrap抽样结果,当偏似然偏差取最小值时,对应的最优正则化参数λ值为0.0519(图3)。此时得到6个用于预后模型构建的基因,即SMS、SMOX、GPC1、SLC47A1、AZIN2和MAOB,每个基因对应的回归系数用于计算风险评分,如图2、图3所示;图2和图3中的箭头指示的是最优正则化参数λ取自然对数后的位置;图2、图3中部分基因数字是相同的,表示不同的λ值对应的相同的基因数目。
[0038]实施例2
[0039]模型验证:
[0040]1.风险评分计算如下:
[0041]风险评分=(0.184292
×
SMS表达水平)+(0.102858
×
SMOX表达水平)+(0.062673
×
GPC1表达水平) +(

0.076306
×
SLC47A1表达水平)+(

0.028864
×
AZIN2表达水平) +(

0.020893
×
MAOB表达水平)。根据计算的中位风险评分,分为高风险组和低风险组,高风险组的OS显著低于低风险组(P<0.001,图7)。
[0042]根据ROC曲线,1年、3年、5年生存预后模型的AUC分别为0.671、0.702、0.670(图4),表明模型具有较好的预测效果;单因素和多因素COX结果表明风险评分也可作为独立预后因素(图5、图6)。
[0043]2. GSE3141、GSE31210、GSE41271、GSE42127和GSE50081验证集中高风险组OS显著低于低风险组(分别如图8、图9、图10、图11和图12所示),成功验证本专利技术的普适性。
[0044]本实施例的多胺代谢相关基因组合预后模型C

index相较于单基因模型提高约10.5%,相较于多基因模型提高约7.9%,如表1所示:
[0045]表1本专利技术多胺代谢相关基因特征准确性、普适性验证
[0046]虽然本专利技术以较佳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种肺腺癌预后模型,其特征在于:所述肺腺癌预后模型基于六种多胺代谢相关基因进行构建,所述六种多胺代谢相关基因为SMS、SMOX、GPC1、SLC47A1、AZIN2和MAOB,其构建方法为,包括下述步骤:(1)从癌症基因组图谱数据库和基因表达综合数据库中收集构建多胺代谢相关基因肺腺癌预后模型的训练集和验证集;(2)从KEGG、GO数据库和文献中整理多胺代谢相关基因;(3)通过LASSO

COX回归构建多胺代谢相关基因的预后...

【专利技术属性】
技术研发人员:曹邦荣马容赵琪李枭虓张瀚
申请(专利权)人:四川省肿瘤医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1