模型训练的方法、时长预测的方法、系统、设备及介质技术方案

技术编号：25551473 阅读：31 留言：0更新日期：2020-09-08 18:51

本发明专利技术公开了一种模型训练的方法、时长预测的方法、系统、设备及介质，其中模型训练的方法，包括以下步骤：获取多个酒店订单的历史数据；从所述历史数据中提取特征数据，将获取到的所述特征数据输入xgboost模型进行训练，当所述历史数据中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时，生成订单回复时长预测模型。本发明专利技术提供的模型训练的方法和订单回复时长预测的方法解决了业务人员根据业务经验判断酒店订单的催单时间，预测准确率低的缺陷；提高了酒店订单的回复时长预测的准确性，最终降低了催单率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练的方法、时长预测的方法、系统、设备及介质
本专利技术涉及模型训练技术，尤其涉及一种模型训练的方法、时长预测的方法、系统、设备及介质。
技术介绍
大型的互联网公司针对部分供应商称之为代理通，例如，华闽和大都市为酒店业务最常见的供应商。每个酒店下可对应多家子酒店，该子酒店可以分别由多家不同的旅行社代理销售，因而上述旅行社也称之为代理通。用户在互联网客户端上下单代理通订单时，需要等供应商确认该订单中酒店房间的库存情况后，互联网公司才能最后确认给用户该订单中的酒店商品是否真实可订。此过程中用户存在等候时间差，称之为确认时长，该确认时长的开始时间点为用户下单时间点，截止时间点是供应商回复时间点。若确认时长过长，则会影响用户体验。因此，互联网公司针对该问题采取了人工催单的方式，根据酒店订单类型以及下单时间点来预测该酒店订单所需的等候时间。现有技术中该等候时间完全由业务人员根据业务经验制定，大量不必要的催单会造成人力成本的升高，并且完全由业务人员根据业务经验判断催单时间，预测准确率低。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中业务人员根据业务经验判断酒店订单的催单时间，预测准确率低的缺陷，提供一种模型训练的方法、时长预测的方法、系统、设备及介质。本专利技术是通过下述技术方案来解决上述技术问题：第一方面，本专利技术提供一种模型训练的方法，所述方法包括：获取多个酒店订单的历史数据；从所述历史数据中提取特征数据，其中，所述特征数据包括用户下单...

【技术保护点】
1.一种模型训练的方法，其特征在于，所述方法包括：/n获取多个酒店订单的历史数据；/n从所述历史数据中提取特征数据，其中，所述特征数据包括用户下单时间点信息、订单类型信息、酒店静态属性信息、节假日信息以及酒店供应商的渠道信息，所述用户下单时间点信息用于表征下单时间点处于工作时段或非工作时段；/n将获取到的所述特征数据输入xgboost模型进行训练，当所述历史数据中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时，生成订单回复时长预测模型；其中，所述xgboost模型为根据所述特征数据构造的多棵串行的树结构模型。/n

【技术特征摘要】
1.一种模型训练的方法，其特征在于，所述方法包括：
获取多个酒店订单的历史数据；
从所述历史数据中提取特征数据，其中，所述特征数据包括用户下单时间点信息、订单类型信息、酒店静态属性信息、节假日信息以及酒店供应商的渠道信息，所述用户下单时间点信息用于表征下单时间点处于工作时段或非工作时段；
将获取到的所述特征数据输入xgboost模型进行训练，当所述历史数据中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时，生成订单回复时长预测模型；其中，所述xgboost模型为根据所述特征数据构造的多棵串行的树结构模型。

2.如权利要求1所述的模型训练的方法，其特征在于，所述将获取到的所述特征数据输入xgboost模型进行训练的步骤，包括：
获取所述xgboost模型以及损失函数的初始超参数值；
基于所述损失函数的初始超参数值对所述xgboost模型进行初始化；
根据所述特征数据以及所述损失函数，对初始化后的所述xgboost模型的初始超参数值进行参数调整以使得对应的损失函数减小；
当每次调整后的所述xgboost模型对应的损失函数不再继续减小时，则将调整后的所述xgboost模型的超参数值确定为目标参数值，所述目标参数值对应的损失函数为目标损失函数；
调整所述目标损失函数的叶子节点权重使得所述xgboost模型输出的预测值更接近所述真实值。

3.如权利要求2所述的模型训练的方法，其特征在于，所述xgboost模型的损失函数是通过以下公式获得：

其中，L表示所述损失函数，T表示当前所述树结构模型中叶子节点的数量，ft(xi)表示当前所述树结构模型的函数表示，γ表示控制叶子数量的超参数，λ表示控制叶子权重的L2超参数，w表示叶子权重，yi表示当前所述树结构模型的真实值，表示前t-1棵所述树结构模型的预测值，表示偏导数，l表示残差方程，n表示酒店订单的历史数据总数。

4.如权利要求1所述的模型训练的方法，其特征在于，所述方法还包括：
获取所述多个酒店订单对应的所述历史数据之后，对所述历史数据进行预处理操作，其中，所述预处理操作包括剔除订单回复时长大于预设时长的所述酒店订单。

5.一种模型训练的系统，其特征在于，所述系统包括：
获取模块，用于获取多个酒店订单的历史数据；
提取模块，用于从所述历史数据中提取特征数据，其中，所述特征数据包括用户下单时间点信息、订单类型信息、酒店静态属性信息、节假日信息以及酒店供应商的渠道信息，所述用户下单时间点信息用于表征下单时间点处于工作时段或非工作时段；
训练模块，用于将获取到的所述特征数据输入xgboost模型进行训练，当所述历史数据中订单回复时长的真实值与所述xgboost模型输出的预测值之间误差的绝对值最小时，生成订单回复时长预测模型；其中，所述xgboost模型为根据所述特征数据构造的多棵串行的树结构模型。

6.如权利要求5所述的模型训练的系统，其特征在于，所述训练模块，包括：
获取单元，用于获取所述xgboost模型以及损失函数的初始超参数值；
初始化单元，用于基于所述损失函数的初始超参数值对所述xgboost模型进行初始化...

【专利技术属性】
技术研发人员：黎建辉，邹亚鹏，胡泓，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人