一种旅客空铁联运方案推荐方法、系统及设备和介质技术方案

技术编号:39181425 阅读:11 留言:0更新日期:2023-10-27 08:29
本申请公开了一种旅客空铁联运方案推荐方法,方法包括:获取一时段内的空铁联运原始数据集,处理空铁联运原始数据集的属性数据,将出发及到达点名字属性信息采用经纬度属性信息代替,并处理空铁联运原始数据集的标签数据,将中转城市与运输方式的标签结合形成数字类型标签后,生成用于训练和测试的空铁联运数据集合;基于空铁联运数据集合,采用模型参数优化方法进行模型训练参数的优化,并根据预测准确率的变化判断空铁联运模型过拟合情况,最终确定空铁联运模型的各个训练参数,训练出更优空铁联运模型;基于更优空铁联运模型,传入实际旅客旅行需求数据,输出旅客空铁联运方案的推荐结果。本申请还公开了一种旅客空铁联运方案推荐系统。方案推荐系统。方案推荐系统。

【技术实现步骤摘要】
一种旅客空铁联运方案推荐方法、系统及设备和介质


[0001]本申请涉及一种旅客联运方案推荐方法,特别涉及旅客空铁联运方案推荐方法及其系统。

技术介绍

[0002]当前,铁路与民航的联合运输是目前综合交通发展的一个趋势,合理且高效地推荐空铁联运方案将会大大提高企业的经济效益和旅客的出行体验。空铁联运方案的推荐包括两部分推荐,分别是空铁联运中转城市推荐和空铁联运运输方式推荐。空铁联运中转城市推荐的研究目前相对较多,有使用传统算法解决的,还有使用机器学习算法的解决的。对于空铁联运运输方式推荐的研究目前刚刚起步,缺少对这部分的研究。在实际生产使用过程中,由于系统缺少空铁联运运输方式推荐,中转城市方案计算出来后,系统需要多次继续遍历运输方式的列表才能完整地推荐整个方案,造成系统运行效率低下。
[0003]目前XGBoost算法模型在研究与实践的各方面都取得较好的效果,因此得到了广泛应用,如交通流量预测、铁路运输、民航运输等方面。但在使用XGBoost算法时,容易出现过拟合问题,使得训练时的预测效果较好,而实际生产使用时的预测效果较差,需要注意这个问题带来的严重影响。另一方面空铁联运推荐有两个数据标签,分别是中转城市和运输方式,属于多标签多分类问题,XGBoost算法不能够直接处理。
[0004]因此,亟需提出一种旅客联运方案推荐方法及其系统,使用XGBoost算法时,减少容易出现过拟合问题的影响,使得训练出来的模型在实际生产使用时也达到较好的预测效果;此外,采用空铁联运推荐两个数据标签结合方法,有效解决XGBoost算法所面临的现有多标签多分类的技术问题。

技术实现思路

[0005]本申请实施例提供了一种旅客联运方案推荐方法及其系统,减少XGBoost算法容易出现过拟合问题的影响,及有效解决XGBoost算法所面临的现有多标签多分类的技术问题。
[0006]第一方面,本申请实施例提供了一种旅客空铁联运方案推荐方法包括:
[0007]空铁联运数据获取及处理步骤:获取一时段内的空铁联运原始数据集,处理空铁联运原始数据集的属性数据,将出发及到达点名字属性信息采用经纬度属性信息代替,并处理空铁联运原始数据集的标签数据,将中转城市与运输方式的标签结合形成数字类型标签后,生成用于训练和测试的空铁联运数据集合;
[0008]空铁联运模型训练步骤:基于空铁联运数据集合,采用模型参数优化方法进行模型训练参数的优化,并根据预测准确率的变化判断空铁联运模型过拟合情况,最终确定空铁联运模型的各个训练参数,训练出更优空铁联运模型;
[0009]空铁联运方案推荐步骤:基于更优空铁联运模型,传入实际旅客旅行需求数据,输出旅客空铁联运方案的推荐结果。
[0010]本专利技术实施例中,上述空铁联运数据获取及处理步骤进一步包括:
[0011]数据获取步骤:获取旅客在时段内的空铁联运实际选择方案数据、旅客个体特征信息数据及日期特征数据,整合成空铁联运原始数据集;
[0012]属性数据处理步骤:将空铁联运原始数据集的出发及到达点名字信息用出发及到达点对应的经纬度信息代替,计算出发及到达点与最近的机场距离和最近中转城市的机场距离,生成新的属性信息;
[0013]数据模拟步骤:将旅客出发时间加上模拟随机值并按照预设比例进行取空值的模拟化处理;
[0014]标签数据处理步骤:将空铁联运原始数据集的中转城市与运输方式标签结合生成数字类型标签,并将数字类型标签按数字从小到大顺序进行对应排序。
[0015]本专利技术实施例中,上述空铁联运数据获取及处理步骤进一步包括:
[0016]最终数据集合步骤:空铁联运数据集包括多个数据包,每条数据包包括:出发及到达点经纬度、距离出发及到达点最近的机场距离、距离出发及到达点最近中转城市的机场距离、旅客年龄、旅客性别、出发时间、出发日期前二天到出发日期后二天之间的节假日情况及新的数字标签。
[0017]本专利技术实施例中,上述空铁联运模型训练步骤进一步包括:
[0018]空铁联运模型选取步骤:空铁联运模型采用XGBoost算法模型;
[0019]准确率计算步骤:通过计算预测准确率,评价被准确分类的样本数在所有样本数中的占比。
[0020]本专利技术实施例中,上述空铁联运模型训练步骤中模型参数优化方法进一步包括:
[0021]模型参数初步优化步骤:固定预设参数,调整正则参数和样本采样参数的取值,当训练集合和测试集合的预测准确率分数大于等于80%,且训练集合和测试集合的预测准确率分数的差值小于等于0.02时,则确定正则参数和样本采样参数的取值;
[0022]模型参数网格搜索步骤:将空铁联运数据集按照预设比例分成新训练集合和测试集合,采用网格搜索预设参数的取值,预设参数包括:n_estimators、max_depth及eta,其中n_estimators取值范围为[20,40,60,80,100,120,140,180,200],max_depth取值范围为[3,4,5,6],eta取值范围为[0.05,0.1,0.2,0.5,1]。
[0023]本专利技术实施例中,上述空铁联运模型训练步骤进一步包括:
[0024]基于模型参数优化方法确定的参数,在新训练集合上训练出最终的XGBoost模型,并进行空铁联运数据集的各个属性参数的属性重要性分数排序。
[0025]本专利技术实施例中,上述准确率计算步骤:
[0026]预测准确率Accuracy的计算公式如下:
[0027][0028]其中,TP表示样本为正样本,预测结果为正样本。TN表示样本为负样本,预测结果为负样本。FP表示样本为负样本,预测结果为正样本。FN表示样本为正样本,预测结果为负样本。
[0029]第二方面,本申请实施例提供了一种旅客空铁联运方案推荐系统,采用如上所述旅客空铁联运方案推荐方法,系统包括:
[0030]空铁联运数据获取及处理模块:获取一时段内的空铁联运原始数据集,处理空铁联运原始数据集的属性数据,将出发及到达点名字属性信息采用经纬度属性信息代替,并处理空铁联运原始数据集的标签数据,将中转城市与运输方式的标签结合形成数字类型标签后,生成用于训练和测试的空铁联运数据集合;
[0031]空铁联运模型训练模块:基于空铁联运数据集合,采用模型参数优化方法进行模型训练参数的优化,并根据预测准确率的变化判断空铁联运模型过拟合情况,最终确定空铁联运模型的各个训练参数,训练出更优空铁联运模型;
[0032]空铁联运方案推荐模块:基于更优空铁联运模型,传入实际旅客旅行需求数据,输出旅客空铁联运方案的推荐结果。
[0033]第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的旅客空铁联运方案推荐方法。
[0034]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种旅客空铁联运方案推荐方法,其特征在于,所述方法包括:空铁联运数据获取及处理步骤:获取一时段内的空铁联运原始数据集,处理所述空铁联运原始数据集的属性数据,将出发及到达点名字属性信息采用经纬度属性信息代替,并处理所述空铁联运原始数据集的标签数据,将中转城市与运输方式的标签结合形成数字类型标签后,生成用于训练和测试的空铁联运数据集合;空铁联运模型训练步骤:基于所述空铁联运数据集合,采用模型参数优化方法进行模型训练参数的优化,并根据预测准确率的变化判断空铁联运模型过拟合情况,最终确定空铁联运模型的各个训练参数,训练出更优空铁联运模型;空铁联运方案推荐步骤:基于所述更优空铁联运模型,传入实际旅客旅行需求数据,输出旅客空铁联运方案的推荐结果。2.根据权利要求1所述旅客空铁联运方案推荐方法,其特征在于,所述空铁联运数据获取及处理步骤进一步包括:数据获取步骤:获取旅客在所述时段内的空铁联运实际选择方案数据、旅客个体特征信息数据及日期特征数据,整合成空铁联运原始数据集;属性数据处理步骤:将所述空铁联运原始数据集的出发及到达点名字信息用所述出发及到达点对应的经纬度信息代替,计算出发及到达点与最近的机场距离和最近中转城市的机场距离,生成新的属性信息;数据模拟步骤:将旅客出发时间加上模拟随机值并按照预设比例进行取空值的模拟化处理;标签数据处理步骤:将所述空铁联运原始数据集的中转城市与运输方式标签结合生成数字类型标签,并将所述数字类型标签按数字从小到大顺序进行对应排序。3.根据权利要求2所述旅客空铁联运方案推荐方法,其特征在于,所述空铁联运数据获取及处理步骤进一步包括:最终数据集合步骤:所述空铁联运数据集包括多个数据,每条所述数据包括:出发及到达点经纬度、距离出发及到达点最近的机场距离、距离出发及到达点最近中转城市的机场距离、旅客年龄、旅客性别、出发时间、出发日期前二天到出发日期后二天之间的节假日情况及新的数字标签。4.根据权利要求1所述旅客空铁联运方案推荐方法,其特征在于,所述空铁联运模型训练步骤进一步包括:空铁联运模型选取步骤:所述空铁联运模型采用XGBoos t算法模型;准确率计算步骤:通过计算预测准确率,评价被准确分类的样本数在所有样本数中的占比。5.根据权利要求4所述旅客空铁联运方案推荐方法,其特征在于,所述空铁联运模型训练步骤中所述模型参数优化方法进一步包括:模型参数初步优化步骤:固定预设参数,调整正则参数和样本采样参数的取值,当所述训练集合和测试集合的预测准确率分数大于等于80%,且所述训练集合...

【专利技术属性】
技术研发人员:单杏花赵楠朱建军阎志远张涛杨立鹏白广栋翁湦元黄家玮张启蒙李松张鹏钱克非张晨阳
申请(专利权)人:中国国家铁路集团有限公司北京经纬信息技术有限公司中国铁道科学研究院集团有限公司电子计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1