当前位置: 首页 > 专利查询>四川大学专利>正文

基于Stacking的民航顾客满意度预测算法制造技术

技术编号:41749104 阅读:26 留言:0更新日期:2024-06-21 21:34
本发明专利技术涉及2种基于Stacking的民航顾客满意度预测算法,具体包括CXR‑Stacking和C5XR‑Stacking。经过集成学习之后,预测精度得到了提高,效果优于单个模型。本文将CatBoost、XGBoost和RF进行了Stacking,得到了两个模型,CXR‑Stacking和C5XR‑Stacking。其中CXR‑Stacking的第一层由1个CatBoost,1个XGBoost和1个RF组成,在contact数据集上的AUC值为0.963。C5XR‑Stacking的第一层由5个CatBoost,1个XGBoost和一个RF组成,得到了最好的效果,在contact数据集上的AUC值为0.964。

【技术实现步骤摘要】

本专利技术涉及集成学习领域,尤其是stacking,具体是2种stacking的民航顾客满意度预测算法。


技术介绍

1、如今,民用航空行业面临客源流失、顾客满意度下降等问题。与此同时,民航领域积累了大量的历史数据,数以亿计的数据还在从世界各地源源不断地产生。如何利用航空大数据,解决当前问题,实现精准定位低满意度人群,继而提高顾客满意度和忠诚度,成为了当前的一个研究热点。预测民航顾客满意度,可实现精准定位低满意度人群,全面有效地利用数据。

2、针对民航顾客满意度预测精度不高的问题,提出了2种新模型。这2种基于voting的民航顾客满意度预测算法,具体包括cxr-hard-voting和cxr-soft-voting。经过集成学习之后,预测精度得到了提高,效果优于单个模型。本专利技术将catboost、xgboost和randomforest进行了voting,得到了两个模型,cxr-hard-voting和cxr-soft-voting。其中cxr-hard-voting由1个catboost,1个xgboost和1个rf经过硬投票得到,在con本文档来自技高网...

【技术保护点】

1.基于Stacking的民航顾客满意度预测算法,其特征在于,所述方法包括以下步骤:

2.根据权利要求书1中所述的基于Stacking的民航顾客满意度预测算法,其特征在于,所述步骤1中Stacking是一种集成学习方法,模型结构一般为2层,一般将数据集分为3部分,训练集、验证集和测试集,分别让第一层的三个分类器进行学习,将三个分类器获得的结果输入到下一层分类器,最后的预测结果就是最后一层分类器获得的结果,CXR-Stacking是将上文中七种模型中表现排名前三的模型通过Stacking进行了集成,CXR表示的含义即为CatBoost、XGBoost和RF,C5XR-Stack...

【技术特征摘要】

1.基于stacking的民航顾客满意度预测算法,其特征在于,所述方法包括以下步骤:

2.根据权利要求书1中所述的基于stacking的民航顾客满意度预测算法,其特征在于,所述步骤1中stacking是一种集成学习方法,模型结构一般为2层,一般将数据集分为3部分,训练集、验证集和测试集,分别让第一层的三个分类器进行学习,将三个分类器获得的结果输入到下一层分类器,最后的预测结果就是最后一层分类器获得的结果,cxr-stacking是将上文中七种模型中表现排名前三的模型通过stacking进行了集成,cxr表示的含义即为catboost、xgboost和rf,c5xr-stacking也是将上文中七种模型中表现排名前三的模型通过stacking进行了集成,但是与cxr-stacking的不同之处在于,第一层采用了5个catboost,1个xgboost和1个rf,而cxr-stacking的第一层组成为1个catboost,1个xgboost和1个rf。

3.根据权利要求书1中所述的基于stacking的民航顾客满意度预测算法,其特征在于,所述步骤1中cxr-stacking和c5xr-stacking模型结构,cxr-stacking模型由两层组成,第一层为1个catboost,1个xgboost和1个rf,第二层为七种模型中表现最好的catboost,训练集数据经过第一层,模型训练之后,丢掉原来的标签,将第一层分类器学习到的标签作为第二层分类器的输入,得到最终的预测结果,c5xr-stacking模型由两层组成,第一层为5个catboost,1个xgboost和1个rf,第二层为七种模型中表现最好的catboost,训练集数据经过第一层,模型训练之后,丢掉原来的标签,将第一层分类器学习到的标签作为第二层分类器的输入,得到最终的预测结果,c5xr-stacking模型是由cxr-stacking模型经过单个分类器模型的数量的调整而来,考虑到catboost在contact数据集上表现较好,所以优先考虑增加catboost模型的数目,本章在增加的模型上进行一些调参的工作,使得模型符合stacking“准而不同”的原则,经...

【专利技术属性】
技术研发人员:李春江张媛媛邹可欣刘畅刘诗佳陈俊任黄飞炀张国彬林乘毅陈良银
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1