一种基于KRAS突变结肠癌基因的预后模型及其应用制造技术

技术编号:35270924 阅读:15 留言:0更新日期:2022-10-19 10:42
本发明专利技术公开了一种基于KRAS突变结肠癌基因的预后模型及其应用,预后模型为APOL3、AUTS2、CD6、COG2、CUL1、CYP1B1、DBI、DHX29、FDFT1、GATA6、IFI27、LHPP、LONRF3、MEST、MMRN2、MRPS35、NLE1、NUP107、PLA2R1、POP4、PPP1R8、PSMG2、RHOBTB1、RHOF、S1PR2、SHC1、SLC2A5、SLCO2A1、SNRNP35、SSBP2、SYNGR1、TMEM159、TRIT1、VPS28、YTHDF2、ZNF552的组合。预后模型有很好的表现,为KRAS突变的COAD患者个体化预后管理提供新的策略。后管理提供新的策略。后管理提供新的策略。

【技术实现步骤摘要】
一种基于KRAS突变结肠癌基因的预后模型及其应用


[0001]本专利技术是关于预后模型的
,特别是关于一种基于KRAS突变结肠癌基因的预后模型及其应用。

技术介绍

[0002]结肠癌是一种常见的恶性肿瘤,根据国际癌症研究机构(International Agency for Research on cancer,IARC)报告的癌症统计数据,2020年全球CRC新发病例超过190万,死亡病例90万,CRC已成为全球癌症死亡的第二大原因。目前,粪便潜血检查(FOBT)、粪便免疫化学检查(FIT)、软性乙状结肠镜检查(FS)等方法已被开发用于早期诊断,有助于提高结直肠癌的预后。即便如此,许多结直肠癌患者在晚期才被诊断出来。因此,CRC患者的预后仍然较差。
[0003]手术加辅助化疗是治疗非转移性肿瘤的有效方法。然而,转移性结直肠癌(mCRC)患者的预后非常差,即使接受治疗,复发率也很高。
[0004]本专利技术中,通过利用多种大型医学数据库:包括3个微阵列数据集和2个RNA

seq数据集,以及TCGA数据库,采用LASSO

COX回归分析从211个与KRAS预后相关的基因中筛选出36个与结肠癌KRAS基因突变相关的基因,根据所选基因的表达水平和差异计算样本的风险评分,建立了一个分子预测模型,将伴有KRAS基因突变结肠癌患者分层为高风险和低风险,有利于临床医师更精准地对伴有KRAS突变结肠癌制定合理、个性化的治疗方案。
[0005]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

[0006]本专利技术的目的在于提供一种基于KRAS突变结肠癌基因的预后模型,基于36个基因组合的预后模型,特别是在KRAS突变的COAD中,该模型在多个队列中都有很好的表现。
[0007]为实现上述目的,本专利技术提供了一种基于KRAS突变结肠癌基因的预后模型,所述预后模型为基因APOL3、AUTS2、CD6、COG2、CUL1、CYP1B1、DBI、DHX29、FDFT1、GATA6、IFI27、LHPP、LONRF3、MEST、MMRN2、MRPS35、NLE1、NUP107、PLA2R1、POP4、PPP1R8、PSMG2、RHOBTB1、RHOF、S1PR2、SHC1、SLC2A5、SLCO2A1、SNRNP35、SSBP2、SYNGR1、TMEM159、TRIT1、VPS28、YTHDF2、ZNF552的组合。
[0008]进一步的,采用以下步骤进行建立:
[0009]S1:数据采集与预处理:获取样本的矩阵数据及相应的临床信息,所述矩阵数据共包括5个COAD数据集,分别为3个微阵列数据集和2个RNA

seq数据集;3个微阵列数据集分别为GSE41258数据集、GSE39582数据集和GSE17536数据集;2个RNA

seq数据集包括TCGA

COAD队列和CPTAC

COAD队列;
[0010]S2:预后模型构建:基于获取的数据,进行单因素Cox分析,采用LASSO

COX回归建立预后模型。
[0011]进一步的,步骤S2包括以下具体的步骤:
[0012]S201:将GSE39582中的KRAS突变样本随机化到训练集和测试集;
[0013]S202:采用最小绝对收缩和选择算子建立预后模型,并利用训练集中的“glmnet”R包采用LASSO

COX回归建立预后模型。
[0014]上述的基于KRAS突变结肠癌基因的预后模型,在KRAS突变型结肠癌患者的预后预测上的应用。
[0015]与现有技术相比,根据本专利技术的一种基于KRAS突变结肠癌基因的预后模型及其应用,建立了一个新的预后模型,特别是应用于KRAS突变的COAD患者中,该模型在多个队列中都有很好的表现,能够为KRAS突变的COAD患者的个体化预后管理提供了新的策略,为精准治疗提供新的思路。
附图说明
[0016]图1是根据本专利技术一实施方式的预后模型的36个基因与KRAS基因的功能相似性的示意图;
[0017]图2是根据本专利技术一实施方式的预后模型的36个基因在GSE39582中的表达谱图。
具体实施方式
[0018]下面结合附图,对本专利技术的具体实施方式进行详细描述,但应当理解本专利技术的保护范围并不受具体实施方式的限制。
[0019]除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
[0020]根据本专利技术优选实施方式的一种基于KRAS突变结肠癌基因的预后模型的建立方法,其包括以下步骤:
[0021]S1:数据采集与预处理:获取样本的矩阵数据及相应的临床信息。
[0022]本步骤中,矩阵数据共包括5个COAD数据集,分别为3个微阵列数据集和2个RNA

seq数据集。
[0023]3个微阵列数据集分别为GSE41258数据集、GSE39582数据集和GSE17536数据集;2个RNA

seq数据集包括TCGA

COAD队列和CPTAC

COAD队列,获取途径具体如下:
[0024]GSE39582数据集中的数据从GPL570平台中获取。具体地,从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)下载GSE39582中的585例样本的矩阵数据及相应的临床信息,其中,将没有KRAS突变数据以及生存信息的样本剔除,得到541例样本数据。GSE17536数据集中的数据从GPL570平台获取,GSE41258数据集中的数据从GPL96平台中获取。具体地,从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)下载GSE17536中390例样本和GSE41258中182例样本的矩阵数据及相应的临床信息,其中,GSE41258数据集中只有182例原发性肝癌的临床信息数据,所以本专利技术中在GSE41258数据集中只选取这182例样本。
[0025]TCGA

COAD队列:从癌症基因组图谱(TCGA)数据库(https://portal.gdc.cancer.gov)中下载461例样本的转录组谱、突变数据和临床随访信息,将TCGA

COAD队列中不包含完整RNA

seq表达谱、突变谱和临床信息的样本被剔除后,用于后
续分析的样本数为414例,其中包括161例KRAS突变样本(TCGA

COAD队列)。
[0026]CPTAC<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于KRAS突变结肠癌基因的预后模型,其特征在于,所述预后模型为基因APOL3(SEQ ID NO.1)、AUTS2(SEQ ID NO.2)、CD6(SEQ ID NO.3)、COG2(SEQ ID NO.4)、CUL1(SEQ ID NO.5)、CYP1B1(SEQ ID NO.6)、DBI(SEQ ID NO.7)、DHX29(SEQ ID NO.8)、FDFT1(SEQ ID NO.9)、GATA6(SEQ ID NO.10)、IFI27(SEQ ID NO.11)、LHPP(SEQ ID NO.12)、LONRF3(SEQ ID NO.13)、MEST(SEQ ID NO.14)、MMRN2(SEQ ID NO.15)、MRPS35(SEQ ID NO.16)、NLE1(SEQ ID NO.17)、NUP107(SEQ ID NO.18)、PLA2R1(SEQ ID NO.19)、POP4(SEQ ID NO.20)、PPP1R8(SEQ ID NO.21)、PSMG2(SEQ ID NO.22)、RHOBTB1(SEQ ID NO.23)、RHOF(SEQ ID NO.24)、S1PR2(SEQ ID NO.25)、SHC1(SEQ ID NO.26)、SLC2A5(SEQ ID NO.27)、SLCO2A1(SEQ ID NO.28)、SNRNP35(SEQ ID NO.29)、SSBP2(SEQ ID NO.30)、SYNGR1(SEQ ID NO.31)、TMEM159(SE...

【专利技术属性】
技术研发人员:董伟伟张鹤赵慧霞张丰云曾志艳胡琰琰李秋文肖文华
申请(专利权)人:中国人民解放军总医院第五医学中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1