一种基于梯度生存提升树的生存分析风险函数预测方法技术

技术编号:26343766 阅读:89 留言:0更新日期:2020-11-13 20:49
本发明专利技术涉及一种基于梯度生存提升树的生存分析风险函数预测方法,包括以下步骤:S1:获取生存分析样本数据,进行预处理;S2:基于贪婪的分割算法构建梯度提升树预测模型;S3:利用训练数据对梯度提升树预测模型进行训练;S4:将预处理完成的生存分析样本数据输入梯度提升树预测模型,输出预测得到的风险函数,与现有技术相比,本发明专利技术具有准确度、泛化性能和可解释性等优点。

【技术实现步骤摘要】
一种基于梯度生存提升树的生存分析风险函数预测方法
本专利技术涉及生存分析领域,尤其是涉及一种基于梯度生存提升树的生存分析风险函数预测方法。
技术介绍
生存分析,常用于保险精算、生物医学领域,目前是信用风险统计领域的热点模型。与传统的回归问题不同,生存分析的研究目标为某个事件在特定时间点发生的概率,进而估计用户随时间变化的生存曲线,而不仅仅是预测一个目标变量。传统的生存分析方法一般对用户个体的风险函数做出某种假设,并设置模型参数与个体协变量为线性关系,其模型的预测性能与假设的准确性关联很大,一旦假设不准,模型的预测能力将大大降低。生存分析的方法一般可以分为三类:(1)Cox比例风险回归模型。Cox比例风险模型假定各危险因素的作用不随时间的变化而变化,模型中的协变量与对数风险比呈线性关系,以优化数据对应的偏似然函数为目标,可以得到易于解释的模型,但该方法在一定程度上限制了模型的表达能力,无法表示一些比较复杂的非线性关系。(2)随机生存森林(Randomforest)方法。随机生存森林方法主要基于生存分析中的无参数估计方法,而本文档来自技高网...

【技术保护点】
1.一种基于梯度生存提升树的生存分析风险函数预测方法,其特征在于,包括以下步骤:/nS1:获取生存分析样本数据,进行预处理;/nS2:基于贪婪的分割算法构建梯度提升树预测模型;/nS3:利用训练数据对梯度提升树预测模型进行训练;/nS4:将预处理完成的生存分析样本数据输入梯度提升树预测模型,输出预测得到的风险函数。/n

【技术特征摘要】
1.一种基于梯度生存提升树的生存分析风险函数预测方法,其特征在于,包括以下步骤:
S1:获取生存分析样本数据,进行预处理;
S2:基于贪婪的分割算法构建梯度提升树预测模型;
S3:利用训练数据对梯度提升树预测模型进行训练;
S4:将预处理完成的生存分析样本数据输入梯度提升树预测模型,输出预测得到的风险函数。


2.根据权利要求1所述的一种基于梯度生存提升树的生存分析风险函数预测方法,其特征在于,所述的生存分析样本数据的表达式为:
(xi,ti,yi),i=1,2,…,n
其中,(xi,ti,yi)为第i个观测对象的生存数据,n为观测对象的总个数,xi为第i个观测对象的协变量,ti为第i个观测对象的末次观测时间,yi为在ti时刻是否观测到第i个观测对象发生特定事件,yi=-1表示在ti时刻未观测到第i个观测对象发生特定事件,yi=1表示在ti时刻观测到第i个观测对象发生特定事件。


3.根据权利要求1所述的一种基于梯度生存提升树的生存分析风险函数预测方法,其特征在于,所述的步骤S2具体包括:
S21:构建梯度提升树预测模型的损失函数;
S22:计算损失函数的一阶导和二阶导;
S23:通过贪婪分割算法每次计算最优的切分损失,得到分割的最大分数以及分割点,构建梯度提升生存树预测模型。


4.根据权利要求3所述的一种基于梯度生存提升树的生存分析风险函数预测方法,其特征在于,所述的梯度提升树预测模型的损失函数的表达式为:



其中,为在独立同分布假设下使用负对数似然函数得到的损失函数,J为观测时间点的个数,τj为第j个观测时间点,Nj为生存时间大于τj-1的用户集合,f为生存...

【专利技术属性】
技术研发人员:雷沁欣程帆张冬梅
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1