一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号：27658230 阅读：15 留言：0更新日期：2021-03-12 14:23

本申请实例公开了一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质，选取历史订单交易数据作为训练样本，从所述训练样本中选取正样本和负样本，所述正样本为参与司机抢单的样本，所述负样本为司机未参与抢单的样本；从所述训练样本中选取基础信息并进行关联；对关联后的数据进行预处理；对预处理后数据进行机器学习模型训练、评估和更新；将训练好的模型部署到线上环境，所述训练好的模型用于预测司机对订单的意愿。在线上服务环节，对于每张订单，我们获取周围N名司机，使用模型预测这N名司机对该订单的意愿，并将其中意愿较低的司机滤除，仅向剩余司机推送该订单。从而让司机看到更感兴趣的订单，为司机提供个性化推送，提升司机使用体验，最终提升平台效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质
本申请实施例涉及订单推送领域，尤其涉及一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质。
技术介绍
物流的核心业务是：用户下单、司机接单并履约的过程，此流程强依赖于一套有效的订单分派系统。原系统的逻辑是，用户创建的新订单需求，随时间推移，逐步广播给更远的司机，直到该订单被司机响应为止。可理解为“按距离分段推送”。原系统存在一个问题，司机收到订单推送过多，其看单和决策效率会下降。
技术实现思路
本申请实施例的目的是提供一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质，旨在解决订单分配的问题，如何通过有效的匹配同时保证三方利益：例如，用户被及时响应、满足，司机在平台上有单、收入高，平台单多、赚钱多。本申请实施例的一个方面提供了一种预测订单意愿的方法，所述方法包括：选取历史订单交易数据作为训练样本，从所述训练样本中选取正样本和负样本，所述正样本为参与司机抢单，所述负样本为司机未参与抢单；从所述训练样本中选取基础信息并进行关联；对关联后的数据进行预处理；对预处理后数据进行机器学习模型训练、评估和更新；将训练好的模型部署到线上环境，所述训练好的模型用于预测司机对订单的意愿。本申请实施例的一个方面又提供了一种预测订单意愿的装置，所述装置包括：选取模块，用于选取历史订单交易数据作为训练样本，从所述训练样本中选取正样本和负样本，所述正样本为参...

【技术保护点】
1.一种预测订单意愿的方法，其特征在于，所述方法包括：/n选取历史订单交易数据作为训练样本，从所述训练样本中选取正样本和负样本，所述正样本为参与司机抢单，所述负样本为司机未参与抢单；/n从所述训练样本中选取基础信息并进行关联；/n对关联后的数据进行预处理；/n对预处理后数据进行机器学习模型训练、评估和更新；/n将训练好的模型部署到线上环境，所述训练好的模型用于预测司机对订单的意愿。/n

【技术特征摘要】
1.一种预测订单意愿的方法，其特征在于，所述方法包括：
选取历史订单交易数据作为训练样本，从所述训练样本中选取正样本和负样本，所述正样本为参与司机抢单，所述负样本为司机未参与抢单；
从所述训练样本中选取基础信息并进行关联；
对关联后的数据进行预处理；
对预处理后数据进行机器学习模型训练、评估和更新；
将训练好的模型部署到线上环境，所述训练好的模型用于预测司机对订单的意愿。

2.根据权利要求1所述的方法，其特征在于，所述训练样本包括：预设区域且第一预设时长内的订单数据，所述订单数据包括被司机响应过的订单。

3.根据权利要求1所述的方法，其特征在于，所述基础信息包括：订单预留的备注文本的长度和/或订单的起终点个数；
所述基础信息还包括：价格、订单车型、下单时间、订单支付方式、所在城市和/或是否跨城；
车辆基础信息包括：车辆类型、大小和/或特殊需求；
司机基础信息包括：会员级别；
场景信息包括：接单距离、天气、供需现况，所述接单距离包括：司机收到播单推送时，距离订单起点的直线距离；所述供需现况包括：每隔第二预设时长在订单当前位置处的供需比；
司机历史画像信息包括：过去预设天数内，所有推送给司机的预设类型订单中，司机参与抢单的次数的占比、过去预设天数司机参与抢单的订单其价格的分位数、司机预设天数完单收入和/或司机历史准点率。

4.根据权利要求1所述的方法，其特征在于，所述对关联后的数据进行预处理，包括：
若接单司机是新司机，则不存在历史画像信息，数据值为空；对于基础信息不做控制填充，用预设的缺失值模型进行处理；对于统计画像信息，用城市预设时间内的司机的画像信息平均值进行填充；或者，
通过贝叶斯平滑技术，获取用户或者司机在历史订单数据少的情况下的特征质量；或者，
样本不平衡处理，对所述负样本做降采样处理。

5.根据权利要求1所述的方法，其特征在于，所述对预处理后数据进行机器学习模型训练、评估和更新，包括：
结合模型效果、训练成本、可解释性、工程成本，选择预设模型作为所述的机器学习模型进行训练，并通过网格搜索方式确定模型超参数；
选择经典排序指标进行评估；
每隔第三预设时长内使用最新数据自动更新一版模型。

【专利技术属性】
技术研发人员：王德健，周友茸，周航，
申请(专利权)人：深圳依时货拉拉科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人