System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 乳腺癌的线粒体相关基因预后模型的构建方法技术_技高网

乳腺癌的线粒体相关基因预后模型的构建方法技术

技术编号:40079266 阅读:11 留言:0更新日期:2024-01-17 02:15
本发明专利技术公开一种乳腺癌的线粒体相关基因预后模型的构建方法,涉及乳腺癌预后模型的构建方法技术领域,该乳腺癌的线粒体相关基因预后模型的构建方法包括如下步骤:步骤一:收集获取乳腺癌的转录组数据和患者的临床数据;步骤二:获取线粒体相关基因;步骤三:生成火山图和热图可视化差异表达基因;步骤四:对线粒体相关的差异表达基因做富集分析;步骤五:筛选出构建预后预测模型的参数并获取相对应的回归系数;步骤六:得到线粒体相关乳腺癌预后预测模型;通过提供的乳腺癌的线粒体相关基因预后模型的构建方法,有利于提高对乳腺癌患者预后的评估预测能力,为乳腺癌患者的早期诊断、治疗起到了指导作用,提高患者的治愈率。

【技术实现步骤摘要】

本专利技术涉及乳腺癌预后模型的构建方法领域技术,尤其是指一种乳腺癌的线粒体相关基因预后模型的构建方法


技术介绍

1、乳腺癌依旧是全球女性疾病负担的主要肿瘤因素,发病率仍呈不断上升的趋势且发病年龄越来越低。由于乳腺癌缺乏有效的治疗靶点,传统的治疗方法包括手术、放疗和化疗在内仍然是主要的治疗方法。同时,因为乳腺癌具有多种临床行为和生物学特征,这给乳腺癌的预防、诊断和治疗都带来了一定的挑战。目前,已有一些研究构建了乳腺癌预后相关模型来预测患者生存。现有模型的主要缺陷:(1)构建方法单一,预测效果有限;(2)采用的统计学算法较简单,无法深度挖掘复杂关系;(3)样本量小,不同人群间迁移性差;(4)生物学解释性不足;此外,暂时没有研究建立乳腺癌的线粒体相关基因的预后模型;申请号为202211359084.9的专利技术公开了一种肿瘤恶性细胞基因预后风险模型构建方法;现有技术中的构建方法,对乳腺癌患者预后的评估预测能力有限;未能将线粒体相关的差异表达基因作为独立的预后因素,预后预测的准确度低;未对线粒体相关基因进行更加科学、精准的筛选,乳腺癌的预后准确性低;因此,针对此现状,迫切需要开发一种乳腺癌的线粒体相关基因预后模型的构建方法,以满足实际使用的需要。


技术实现思路

1、有鉴于此,本专利技术针对现有技术存在之缺失,其主要目的是提供一种乳腺癌的线粒体相关基因预后模型的构建方法,其有利于提高对乳腺癌患者预后的评估预测能力,提高患者的治愈率;能将线粒体相关的差异表达基因作为独立的预后因素,预后预测的准确度高;通过对线粒体相关基因进行更加科学、精准的筛选,进一步提高乳腺癌的预后准确性。

2、为实现上述目的,本专利技术采用如下之技术方案:

3、一种乳腺癌的线粒体相关基因预后模型的构建方法,包括如下步骤:

4、步骤一:分别从多个数据库中收集获取乳腺癌的转录组数据和患者的临床数据,在收集的过程中去除掉临床数据中信息不完整和总生存时间小于30天的样本数据;

5、步骤二:从至少一个数据库中获取线粒体相关基因;

6、步骤三:从步骤一获得的转录组数据中通过r的“limma”包筛选正常样本和肿瘤样本之间的差异表达基因;并将|logfc|>2和矫正后p值<0.05认为是差异表达基因;同时与步骤二获得的线粒体相关基因取交集,得到线粒体相关差异表达基因,即m-degs;使用r的“volcano”包和“heatmap”包用于生成火山图和热图可视化差异表达基因;

7、步骤四:对由步骤三所获得的的线粒体相关差异表达基因分别做go富集和kegg富集分析;分别使用r的“clusterprofiler”,“org.hs.eg.db”,“enrichplot”和“ggplot2”包对线粒体相关的差异表达基因做富集分析;

8、步骤五:从步骤三获得的线粒体相关差异表达基因中筛选出构建预后预测模型的参数并获取相对应的回归系数,所述参数包括多个基因类型;

9、步骤六:基于步骤三筛选出来的线粒体相关差异表达基因,根据其表达量和对应的回归系数,计算风险评分,得到线粒体相关乳腺癌预后预测模型;

10、其中ai表示与乳腺癌生存相关的m-degs的权重系数,bi表示与乳腺癌生存相关的m-degs的表达水平,n表示与乳腺癌生存相关的m-degs的个数。

11、作为一种优选方案:所述步骤三中筛选正常样本和肿瘤样本之间的差异表达基因的条件设置为fdr<0.05、log|fc|>1,通过r语言的“limma”包进行筛选。

12、作为一种优选方案:所述步骤五中从线粒体相关差异表达基因中筛选出构建预后预测模型的参数并获取相对应的回归系数具体包括如下步骤:

13、s51、所述步骤三中得到的线粒体相关差异表达基因为m个,首先将步骤三得到的m个线粒体相关的差异表达基因做进一步单因素cox回归分析得到n个线粒体相关的差异表达基因;

14、s52、将这n个差异表达基因做进一步的蛋白质互作网络分析,最终经cytoscape进行进一步筛选得到五个线粒体相关差异表达基因用于构建预后模型,这五个基因分别是hspe1、mrpl13、mthfd2、apoo和timm17a。

15、作为一种优选方案:所述步骤六中,基于筛选出来的线粒体相关差异表达基因作为建立乳腺癌预后模型的参数,通过岭回归算法并用交叉验证法根据方差最小确定最优调整参数λ,从而确定用于构建预测模型的最优变量。

16、作为一种优选方案:所述步骤一中收集获取乳腺癌的转录组数据和患者的临床数据的数据库包括tcga数据库、geo数据库和ucsc数据库。

17、作为一种优选方案:所述步骤二中获取线粒体相关基因的数据库包括mitocarta数据库、gsea数据库和genecards数据库。

18、作为一种优选方案:所述步骤一中所述患者的临床数据包括患者的年龄、性别、肿瘤分期、生存与否;所述转录组数据包括每个rna在各个样本中的表达水平。

19、作为一种优选方案:所述步骤二中从mitocarta数据库、gsea数据库和genecards数据库中获取线粒体相关基因,采用“mitochondria”为关键词进行检索。

20、作为一种优选方案:所述步骤五的s51中由步骤三中得到的线粒体相关差异表达基因为702个,将步骤三得到的702个线粒体相关的差异表达基因做进一步单因素cox回归分析得到33个线粒体相关的差异表达基因。

21、作为一种优选方案:所述步骤五中构建预后模型的参数包括hspe1、mrpl13、mthfd2、apoo和timm17a;将参数代入步骤六中的预后评分公式得到构建乳腺癌线粒体相关差异表达基因的预后模型为:预后评分=(0.0529×timm17aexp)+(0.0672×apooexp)+(0.0663×hspe1exp)+(0.1303×mrpl13exp)+(0.0585×mthfd2exp),其中下标exp表示对应的m-degs的表达水平。

22、本专利技术与现有技术相比具有明显的优点和有益效果,具体而言,由上述技术方案可知,通过采用本申请提供的乳腺癌的线粒体相关基因预后模型的构建方法,有利于提高对乳腺癌患者预后的评估预测能力,为乳腺癌患者的早期诊断、治疗起到了指导作用,在一定程度上能够改善患者的预后,提高患者的治愈率;能将线粒体相关的差异表达基因作为独立的预后因素,预后预测的准确度高;通过对线粒体相关基因进行更加科学、精准的筛选,使最后确定的线粒体相关的差异表达基因构建的预后模型能适用于大部分乳腺癌的样本进行预后的预测,使其最终的预后模型具有普适性,从而使更多的乳腺癌患者获益,并能够进一步提高乳腺癌的预后准确性。

23、为更清楚地阐述本专利技术的结构特征和功效,下面结合附图与具体实施例来对其进行详细说明。

本文档来自技高网...

【技术保护点】

1.一种乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤三中筛选正常样本和肿瘤样本之间的差异表达基因的条件设置为FDR<0.05、log|FC|>1,通过R语言的“limma”包进行筛选。

3.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤五中从线粒体相关差异表达基因中筛选出构建预后预测模型的参数并获取相对应的回归系数具体包括如下步骤:

4.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤六中,基于筛选出来的线粒体相关差异表达基因作为建立乳腺癌预后模型的参数,通过岭回归算法并用交叉验证法根据方差最小确定最优调整参数λ,从而确定用于构建预测模型的最优变量。

5.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤一中收集获取乳腺癌的转录组数据和患者的临床数据的数据库包括TCGA数据库、GEO数据库和UCSC数据库。p>

6.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤二中获取线粒体相关基因的数据库包括MitoCarta数据库、GSEA数据库和GeneCards数据库。

7.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤一中所述患者的临床数据包括患者的年龄、性别、肿瘤分期、生存与否;所述转录组数据包括每个RNA在各个样本中的表达水平。

8.根据权利要求6所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤二中从MitoCarta数据库、GSEA数据库和GeneCards数据库中获取线粒体相关基因,采用“mitochondria”为关键词进行检索。

9.根据权利要求3所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤五的S51中由步骤三中得到的线粒体相关差异表达基因为702个,将步骤三得到的702个线粒体相关的差异表达基因做进一步单因素COX回归分析得到33个线粒体相关的差异表达基因。

10.根据权利要求9所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤五中构建预后模型的参数包括HSPE1、MRPL13、MTHFD2、APOO和TIMM17A;将参数代入步骤六中的预后评分公式得到构建乳腺癌线粒体相关差异表达基因的预后模型为:预后评分=(0.0529×TIMM17Aexp)+(0.0672×APOOexp)+(0.0663×HSPE1exp)+(0.1303×MRPL13exp)+(0.0585×MTHFD2exp),其中下标exp表示对应的M-DEGs的表达水平。

...

【技术特征摘要】

1.一种乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤三中筛选正常样本和肿瘤样本之间的差异表达基因的条件设置为fdr<0.05、log|fc|>1,通过r语言的“limma”包进行筛选。

3.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤五中从线粒体相关差异表达基因中筛选出构建预后预测模型的参数并获取相对应的回归系数具体包括如下步骤:

4.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤六中,基于筛选出来的线粒体相关差异表达基因作为建立乳腺癌预后模型的参数,通过岭回归算法并用交叉验证法根据方差最小确定最优调整参数λ,从而确定用于构建预测模型的最优变量。

5.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤一中收集获取乳腺癌的转录组数据和患者的临床数据的数据库包括tcga数据库、geo数据库和ucsc数据库。

6.根据权利要求1所述的乳腺癌的线粒体相关基因预后模型的构建方法,其特征在于:所述步骤二中获取线粒体相关基因的数据库包括mitocarta数据库、gsea数据库和genecards数据库。

7.根据权利要求...

【专利技术属性】
技术研发人员:丁茜裴可张梦娜颉丽英蔺宝曾泽皓何跃腾蔡车国胡隽源
申请(专利权)人:深圳市北科源细胞科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1