一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:27657854 阅读:21 留言:0更新日期:2021-03-12 14:22
本申请实例公开了一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质。选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;对关联后的数据进行预处理;对预处理后的数据进行机器学习模型的训练、评估和更新;将离线训练后的模型部署到线上环境。在线上服务环节,对于每张订单,我们获取周围N名司机,使用模型预测这N名司机若与该订单匹配后由于不合适而被迫取消的概率,并将其中取消概率较高的司机滤除,仅向剩余司机推送该订单,从而为用户挑选服务质量更佳、更合适的司机,提升用户体验以及平台效率。

【技术实现步骤摘要】
一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质
本申请实施例涉及订单推送领域,尤其涉及一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质。
技术介绍
核心的物流业务是:用户下单、司机接单并履约(完成装货、配送、卸货)的过程,此流程强依赖于一套有效的订单分派系统。原系统的逻辑是,用户创建的新订单需求,随时间推移,逐步广播给更远的司机,直到该订单被司机响应为止。可理解为“按距离分段推送”。原系统存在一个问题,未对虽然距离近但不合适的司机进行有效过滤。
技术实现思路
本申请实施例的目的是提供一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质,旨在在订单分配问题中,有效地训练出模型,此模型有能力精准预测司乘配对后由于不合适而被迫取消订单的概率。进而能够将此模型用于订单分配系统,有效提升服务质量和司乘体验。本申请实施例的一个方面提供了一种预测订单取消的建模方法,所述方法包括:选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;从所述训练样本中选取特征信息进行关联;对关联后的数据进行预处理;对预处理后的数据进行机器学习模型的训练、评估和更新;将训练后的模型部署到线上环境,所述训练后的模型用于预测司机取消订单的概率。本申请实施例的一个方面又提供了一种预测订单取消的建模装置,所述装置包括:选取模块,用于选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;关联模块,用于从所述正样本中选取特征信息进行关联;预处理模块,用于对关联后的数据进行预处理;训练模块,用于对预处理后的数据进行机器学习模型的训练、评估和更新;排序模块,用于将训练后的模型部署到线上环境,所述训练后的模型用于预测司机取消订单的概率。本申请实施例的一个方面又提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例的一个方面又提供了一种计算机可读存储介质,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例提供一种预测订单取消的建模方法、装置、计算机设备及计算机可读存储介质,选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;从所述训练样本中选取特征信息进行关联;对关联后的数据进行预处理;对预处理后的数据进行机器学习模型的训练、评估和更新;将训练后的模型部署到线上环境,所述训练后的模型用于预测司机取消订单的概率,对司机进行排序,减少了不必要的播单,相对的缓解了司机选择多的选择困难问题。附图说明图1示意性示出了根据本申请实施例的预测订单取消的建模方法的应用环境图;图2示意性示出了根据本申请实施例一的预测订单取消的建模方法的流程图;图3示意性示出了根据本申请实施例二的预测订单取消的建模装置的框图;图4示意性示出了根据本申请实施例三的适于实现预测订单取消的建模方法的计算机设备的硬件架构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。图1示意性示出了根据本申请实施例的环境应用示意图。服务器20通过网络9连接移动终端10。每一个移动终端10里面安置一个客户端12,客户端12用来接收司机的信息。服务器20可以由一个或多个计算设备实现。一个或多个计算设备可以包括虚拟化的计算实例。虚拟化的计算实例可以包括虚拟机,例如计算机系统,操作系统,服务器等的仿真。计算设备可以基于虚拟映像和/或定义用于仿真的特定软件(例如,操作系统,专用应用程序,服务器)的其他数据,由计算设备加载虚拟机。随着对不同类型的处理服务的需求改变,可以在一个或多个计算设备上加载和/或终止不同的虚拟机。可以实现管理程序来管理同一计算设备上不同虚拟机的使用。网络9包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备和/或类似。网络9可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,其组合等。网络9可以包括无线链路,诸如蜂窝链路,卫星链路,Wi-Fi链路等。移动终端10的类型包括:小车、中车或者大车。服务器20接收司机的行程信息,司机的行程信息包括:包括:订单基础信息、车辆基础信息、司机/用户基础信息、场景信息;所述订单基础信息包括:价格、起终点里程、订单车型、下单时间、订单支付方式、所在城市和/或是否跨城;所述车辆基础信息包括:车辆类型、大小和/或特殊需求,所述特殊要求包括:如果车辆无法满足则会导致履约失败;所述司机/用户基础信息包括:会员级别,所述会员级别对应与其履约能力和/或经验;所述场景信息包括:接单距离和天气,所述接单距离包括:司机收到播单推送时,距离订单起点的直线距离。服务器20获取用户发送的信息;以所述信息的经纬度为中心,寻找周围所有的在线司机;获取所述行程信息以及所述在线司机对应的特征数据,所述特征数据包含n个订单对,订单是同一订单,司机对应于n名司机,n为自然数;将n个订单对的特征数据输入预设模型,所述预设模型返回的n个预测分数,所述n个预设分数包括:所述订单如果被各司机接单后的取消概率;根据所述预测分数进行分单决策,输出所述订单对应的待广播司机。实施例一图2示意性示出了根据本申请实施例一的预测订单取消的建模方法的流程图。可以理解,本方法实施例可以被执行在服务器20中,且本方法实施例的流程图不用于对执行步骤的顺序进行限定。如图2所示,该预测订单取消的建模方法可以包括步骤S200~S206,其中:步骤S200,选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的本文档来自技高网...

【技术保护点】
1.一种预测订单取消的建模方法,其特征在于,所述方法包括:/n选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;/n从所述训练样本中选取特征信息进行关联;/n对关联后的数据进行预处理;/n对预处理后的数据进行机器学习模型的训练、评估和更新;/n将训练后的模型部署到线上环境,所述训练后的模型用于预测司机取消订单的概率。/n

【技术特征摘要】
1.一种预测订单取消的建模方法,其特征在于,所述方法包括:
选取历史订单的交易数据作为训练样本,并从所述训练样本中选取正样本和负样本,所述正样本为未完成而取消的订单数据,所述负样本为已完成的订单;
从所述训练样本中选取特征信息进行关联;
对关联后的数据进行预处理;
对预处理后的数据进行机器学习模型的训练、评估和更新;
将训练后的模型部署到线上环境,所述训练后的模型用于预测司机取消订单的概率。


2.根据权利要求1所述的方法,其特征在于,所述训练样本包括:
预设区域且第一预设时长内的订单数据,所述订单数据包括被司机响应过的订单。


3.根据权利要求1所述的方法,其特征在于,所述特征信息包括:订单基础、车辆基础信息、司机或者用户的基础信息、场景信息、司机或者用户的历史画像信息;
所述订单基础信息包括:价格、起终点里程、订单车型、下单时间、订单支付方式、所在城市和/或是否跨城;
所述车辆基础信息包括:车辆类型和/或大小;
所述司机或者用户基础信息包括:会员级别,所述会员级别对应与其履约能力和/或经验;
所述场景信息包括:接单距离和天气,所述接单距离包括:司机收到播单推送时,距离订单起点的直线距离;
所述司机或者用户历史画像信息包括:过去预设天数司机响应后的取消率,和/或过去预设天数司机接单距离的中位数。


4.根据权利要求1所述的方法,其特征在于,所述对关联后的数据进行预处理,包括:
若司机为新司机,则数据值为空;对于基础信息,不做控制填充,通过具有处理缺失值的模型填充;对于统计画像信息,则用对应城市过往第二预设时长内的司机的画像信息平均值进行填充;或者,
采用威尔逊平滑技术,获取用户/司机在历史订单数据少时的特征信息。


5.根据权利要求1所述的方法,其特征在于,所述对预处理后的数据进行机器学习模型的训练、评估和更新,包括:
结合模型效果、训练成本、可解释性、工程成本,选择预设模型作为...

【专利技术属性】
技术研发人员:王德健周友茸石辕
申请(专利权)人:深圳依时货拉拉科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1