基于随机生存森林的肝癌术后复发预测方法、存储介质技术

技术编号:28380076 阅读:19 留言:0更新日期:2021-05-08 00:08
本发明专利技术提供基于随机生存森林的肝癌术后复发预测方法、存储介质,方法包括:获取各病例的临床资料和复发时间;预设入组维度包括病人基本因素、术前检验因素和术后病理因素;依据所述临床资料获取数据集,所述数据集由各病例对应的预设入组维度构成;依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型。本发明专利技术能够准确预测个体病患的肝癌术后复发概率,更好地确定术后关注度;有助于主动预防;特别是针对医疗机构,能够帮助医护人员准确地筛选出肝癌术后高危复发病人,有助于在复发早期进行干预,指导术后随访和治疗。

【技术实现步骤摘要】
基于随机生存森林的肝癌术后复发预测方法、存储介质
本专利技术涉及生物信息学领域,具体涉及基于随机生存森林的肝癌术后复发预测方法、存储介质。
技术介绍
原发性肝癌(以下简称肝癌)是我国最常见的恶性肿瘤之一,发病率居我国肿瘤发病率第四位,死亡率居我国肿瘤致死率第三位,肝癌严重威胁我国人民的生命和健康。目前,手术切除是肝癌根治治疗的主要手段,但是术后复发仍是导致肝癌术后死亡的重要原因。临床资料表明肝癌术后复发率约50%。复发一般以2年为界分为早期复发及晚期复发,早期复发数约占总复发数的70%。因此,利用各种方法对肝癌术后早期复发进行精准预测,筛选早期复发风险高的病人,在临床诊疗中提供适当的监测,以便在复发的早期阶段发现肿瘤,再次给予根治治疗,具有非常高的临床价值。近年来,利用各类机器学习算法实现疾病风险预测,是医疗大数据领域的研究热点,各种复杂算法可以深度挖掘疾病变量间的相互关系,但是主流机器学习算法难以处理具有删失特征的医疗数据,因此依然具有一定偏差,准确率不高。随机生存森林(RSF)是一种可以对右删失生存数据进行分析的随机森林方法。它引入了用于生长生存树的新生存分裂规则,以及用于估算缺失数据的新缺失数据算法,适合生存分析的应用。本申请目的在于基于随机生存森林建立肝癌术后早期复发预测模型的方法、存储介质,以获取更准确的疾病变量关系。
技术实现思路
本专利技术所要解决的技术问题是:提供基于随机生存森林的肝癌术后复发预测方法、存储介质,能够准确预测个体病患的肝癌术后复发概率,为术后关注度提供参考。为了解决上述技术问题,本专利技术采用的技术方案为:基于随机生存森林的肝癌术后复发预测方法,包括:获取所述各病例的临床资料和复发时间;预设入组维度包括病人基本因素、术前检验因素和术后病理因素;依据所述临床资料获取数据集,所述数据集由各病例对应的预设入组维度构成;依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型。本专利技术提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器执行时,能够实现上述基于随机生存森林的肝癌术后复发预测方法所包含的步骤。本专利技术的有益效果在于:本专利技术基于随机生存森林以及一定数量的历史复发病例的临床资料,创建得到肝癌术后早期复发预测模型,能够实现基于该模型对病人进行个体预测,获取其复发情况,有助于主动预防;特别是针对医疗机构,能够帮助医护人员准确地筛选出肝癌术后高危复发病人,有助于在复发早期进行干预,指导术后随访和治疗,从而提高治愈率。附图说明图1为本专利技术一实施例一种基于随机生存森林的肝癌术后复发预测方法的流程示意图;图2为本专利技术实施例二一种基于随机生存森林的肝癌术后复发预测方法的流程示意图;图3为本专利技术实施例五中的预测结果界面效果示例图。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。请参照图1,本专利技术提供基于随机生存森林的肝癌术后复发预测方法,包括:获取所述各病例的临床资料和复发时间;预设入组维度包括病人基本因素、术前检验因素和术后病理因素;依据所述临床资料获取数据集,所述数据集由各病例对应的预设入组维度构成;依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型。从上述描述可知,本专利技术的有益效果在于:能够实现基于该模型对病人进行个体预测,获取其复发情况,有助于主动预防;特别是针对医疗机构,能够帮助医护人员准确地筛选出肝癌术后高危复发病人,有助于在复发早期进行干预,指导术后随访和治疗,从而提高治愈率。进一步地,所述获取各病例的临床资料和复发时间,之前,还包括:获取入组的各病例,所述各病例在术前肝功能评估正常、既往无恶性肿瘤病史、无邻近脏器侵犯及远处转移、进行过肝癌切除手术且术后病理证实为肝细胞癌,以及在术后复发。从上述描述可知,依据上述条件确定合格的入组病例,能够显著提高模型的准确率。进一步地,所述依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型,包括:依据预设比例划分各病例,得到训练组病例和测试组病例;依据所述训练组病例和测试组对所述数据集进行划分,得到训练组数据集和测试组数据集;依据训练组数据集和训练组病例中各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型及其累计风险函数;使用所述累计风险函数对训练组病例中的各个病例进行预测,得到危险分数集;依据预设的比例划分所述危险分数集,得到分别对应低危复发组、中危复发组和高危复发组的风险分数范围。由上述描述可知,还将设置测试组,依据模型获取各测试病例的风险分数;然后依据医学经验及规则划分出不同风险分组对应的分数范围,为后续快速地明确基于模型计算得到的风险分数所属的风险等级提供支持。进一步地,还包括:获取一病例的入组维度;依据所述一病例的入组维度,通过所述肝癌术后早期复发预测模型计算得到所述一病例对应的危险分数;依据计算得到的危险分数所属的风险分数范围,确定对应的风险分组;输出所确定的风险分组。由上述描述可知,能实现直接输出病例所属的风险分组,提供更为直观、易懂的预测结果。进一步地,还包括:将所述肝癌术后早期复发预测模型部署到服务器中,并生成对应的预测网页。由上述描述可知,能够以网页形式提供预测功能,具有操作更简便、更节省流量和更少占用内存和资源等特点。进一步地,还包括:获取一病例的入组维度;依据所述一病例的入组维度,通过所述肝癌术后早期复发预测模型计算得到所述一病例对应的复发情况。由上述描述可知,直接输入病例的入组维度信息,便可快速得知其复发情况,为用户提供更为准确地预测功能。进一步地,所述复发情况包括风险分数、无复发概率及其曲线。由上述描述可知,基于模型计算获取的数据具有直观、全面且精细的特点。进一步地,所述病人基本因素包括年龄和性别;所述术前检验因素包括血小板、白蛋白、总胆红素、病因学检查结果和甲胎蛋白;所述术后病理因素包括肿瘤最大径、肿瘤数量、肉眼血管侵犯、微血管侵犯、卫星子灶、肿瘤包膜、肝癌分化分级和肝硬化类型。由上述描述可知,基于病例足够全面且关键的临床数据分析获取肝癌术后早期复发预测模型,能确保预测结果的准确性。本专利技术提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器执行时,能够实现下述基于随机生存森林的肝癌术后复发预测方法所包含的步骤:获取所述各病例的临床资料和复发时间;预设入组维度包括病人基本因素、术前检验因素和术后病理因素;依据所述临床资料获取数据集,所述数据集由各病例对应的本文档来自技高网
...

【技术保护点】
1.基于随机生存森林的肝癌术后复发预测方法,其特征在于,包括:/n获取各病例的临床资料和复发时间;/n预设入组维度包括病人基本因素、术前检验因素和术后病理因素;/n依据所述临床资料获取数据集,所述数据集由各病例对应的预设入组维度构成;/n依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型。/n

【技术特征摘要】
20200714 CN 20201067193431.基于随机生存森林的肝癌术后复发预测方法,其特征在于,包括:
获取各病例的临床资料和复发时间;
预设入组维度包括病人基本因素、术前检验因素和术后病理因素;
依据所述临床资料获取数据集,所述数据集由各病例对应的预设入组维度构成;
依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型。


2.如权利要求1所述的基于随机生存森林的肝癌术后复发预测方法,其特征在于,所述获取各病例的临床资料和复发时间,之前,还包括:
获取入组的各病例,所述各病例在术前肝功能评估正常、既往无恶性肿瘤病史、无邻近脏器侵犯及远处转移、进行过肝癌切除手术且术后病理证实为肝细胞癌,以及在术后复发。


3.如权利要求1所述的基于随机生存森林的肝癌术后复发预测方法,其特征在于,所述依据数据集和各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型,包括:
依据预设比例划分各病例,得到训练组病例和测试组病例;
依据所述训练组病例和测试组对所述数据集进行划分,得到训练组数据集和测试组数据集;
依据训练组数据集和训练组病例中各病例的复发时间,采用随机生存森林算法构建得到对应的肝癌术后早期复发预测模型及其累计风险函数;
使用所述累计风险函数对训练组病例中的各个病例进行预测,得到危险分数集;
依据预设的比例划分所述危险分数集,得到分别对应低危复发组、中危复发组和高危复发组的风险分数范围。...

【专利技术属性】
技术研发人员:刘景丰曾建兴郭鹏飞刘红枝林孔英陈振伟黄起桢傅俊丁宗仁曾建阳陈传椿李保晟
申请(专利权)人:福州宜星大数据产业投资有限公司福建医科大学孟超肝胆医院福州市传染病医院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1