一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:27658230 阅读:15 留言:0更新日期:2021-03-12 14:23
本申请实例公开了一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质,选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单的样本,所述负样本为司机未参与抢单的样本;从所述训练样本中选取基础信息并进行关联;对关联后的数据进行预处理;对预处理后数据进行机器学习模型训练、评估和更新;将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。在线上服务环节,对于每张订单,我们获取周围N名司机,使用模型预测这N名司机对该订单的意愿,并将其中意愿较低的司机滤除,仅向剩余司机推送该订单。从而让司机看到更感兴趣的订单,为司机提供个性化推送,提升司机使用体验,最终提升平台效率。

【技术实现步骤摘要】
一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质
本申请实施例涉及订单推送领域,尤其涉及一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质。
技术介绍
物流的核心业务是:用户下单、司机接单并履约的过程,此流程强依赖于一套有效的订单分派系统。原系统的逻辑是,用户创建的新订单需求,随时间推移,逐步广播给更远的司机,直到该订单被司机响应为止。可理解为“按距离分段推送”。原系统存在一个问题,司机收到订单推送过多,其看单和决策效率会下降。
技术实现思路
本申请实施例的目的是提供一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质,旨在解决订单分配的问题,如何通过有效的匹配同时保证三方利益:例如,用户被及时响应、满足,司机在平台上有单、收入高,平台单多、赚钱多。本申请实施例的一个方面提供了一种预测订单意愿的方法,所述方法包括:选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单,所述负样本为司机未参与抢单;从所述训练样本中选取基础信息并进行关联;对关联后的数据进行预处理;对预处理后数据进行机器学习模型训练、评估和更新;将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。本申请实施例的一个方面又提供了一种预测订单意愿的装置,所述装置包括:选取模块,用于选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单的样本,所述负样本为司机未参与抢单的样本;关联模块,用于从所述训练样本中选取基础信息并进行关联;预处理模块,用于对关联后的数据进行预处理;更新模块,用于对预处理后数据进行机器学习模型训练、评估和更新;排序模块,用于将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。本申请实施例的一个方面又提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例的一个方面又提供了一种计算机可读存储介质,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。本申请实施例提供的一种预测订单意愿的方法、装置、计算机设备及计算机可读存储介质,选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单的样本,所述负样本为司机未参与抢单的样本;从所述训练样本中选取基础信息并进行关联;对关联后的数据进行预处理;对预处理后数据进行机器学习模型训练、评估和更新;将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。在线上服务环节,对于每张订单,我们获取周围N名司机,使用模型预测这N名司机对该订单的意愿,并将其中意愿较低的司机滤除,仅向剩余司机推送该订单。从而让司机看到更感兴趣的订单,为司机提供个性化推送,提升司机使用体验,最终提升平台效率。附图说明图1示意性示出了根据本申请实施例的环境应用示意图;图2示意性示出了根据本申请实施例一的预测订单意愿的方法的流程图;图3示意性示出了根据本申请实施例二的预测订单意愿的装置的框图;图4示意性示出了根据本申请实施例三的适于实现预测订单意愿的方法的计算机设备的硬件架构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。图1示意性示出了根据本申请实施例的环境应用示意图。服务器20通过网络9连接移动终端10。每一个移动终端10里面安置一个客户端12,客户端12用来接收司机的信息。服务器20可以由一个或多个计算设备实现。一个或多个计算设备可以包括虚拟化的计算实例。虚拟化的计算实例可以包括虚拟机,例如计算机系统,操作系统,服务器等的仿真。计算设备可以基于虚拟映像和/或定义用于仿真的特定软件(例如,操作系统,专用应用程序,服务器)的其他数据,由计算设备加载虚拟机。随着对不同类型的处理服务的需求改变,可以在一个或多个计算设备上加载和/或终止不同的虚拟机。可以实现管理程序来管理同一计算设备上不同虚拟机的使用。网络9包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备和/或类似。网络9可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,其组合等。网络9可以包括无线链路,诸如蜂窝链路,卫星链路,Wi-Fi链路等。移动终端10的类型包括:小车、中车或者大车。服务器20接收司机的行程信息,司机的行程信息包括:包括:订单基础信息、车辆基础信息、司机/用户基础信息、场景信息;所述订单基础信息包括:价格、起终点里程、订单车型、下单时间、订单支付方式、所在城市和/或是否跨城;所述车辆基础信息包括:车辆类型、大小和/或特殊需求,所述特殊要求包括:如果车辆无法满足则会导致履约失败;所述司机/用户基础信息包括:会员级别,所述会员级别对应与其履约能力和/或经验;所述场景信息包括:接单距离和天气,所述接单距离包括:司机收到播单推送时,距离订单起点的直线距离。服务器20获取用户发送的信息;以所述信息的经纬度为中心,寻找周围所有的在线司机;获取所述行程信息以及所述在线司机对应的特征数据,所述特征数据包含n个订单对,订单是同一订单,司机对应于n名司机,n为自然数;将n个订单对的特征数据输入预设模型,所述预设模型返回n个预测分数,所述n个预设分数包括:所述订单如果被各司机接单后的取消概率;根据所述预测分数进行分单决策,输出所述订单对应的待广播司机。实施例一图2示意性示出了根据本申请实施例一的预测订单意愿的方法的流程图。可以理解,本方法实施例可以被执行在服务器20中,且本方法实施例的流程图不用于对执行步骤的顺序进行限定。如图2所示,该预测订单意愿的方法可以包括步骤S200~S208,其中:步骤S200,选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单,所述负样本为司机本文档来自技高网...

【技术保护点】
1.一种预测订单意愿的方法,其特征在于,所述方法包括:/n选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单,所述负样本为司机未参与抢单;/n从所述训练样本中选取基础信息并进行关联;/n对关联后的数据进行预处理;/n对预处理后数据进行机器学习模型训练、评估和更新;/n将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。/n

【技术特征摘要】
1.一种预测订单意愿的方法,其特征在于,所述方法包括:
选取历史订单交易数据作为训练样本,从所述训练样本中选取正样本和负样本,所述正样本为参与司机抢单,所述负样本为司机未参与抢单;
从所述训练样本中选取基础信息并进行关联;
对关联后的数据进行预处理;
对预处理后数据进行机器学习模型训练、评估和更新;
将训练好的模型部署到线上环境,所述训练好的模型用于预测司机对订单的意愿。


2.根据权利要求1所述的方法,其特征在于,所述训练样本包括:预设区域且第一预设时长内的订单数据,所述订单数据包括被司机响应过的订单。


3.根据权利要求1所述的方法,其特征在于,所述基础信息包括:订单预留的备注文本的长度和/或订单的起终点个数;
所述基础信息还包括:价格、订单车型、下单时间、订单支付方式、所在城市和/或是否跨城;
车辆基础信息包括:车辆类型、大小和/或特殊需求;
司机基础信息包括:会员级别;
场景信息包括:接单距离、天气、供需现况,所述接单距离包括:司机收到播单推送时,距离订单起点的直线距离;所述供需现况包括:每隔第二预设时长在订单当前位置处的供需比;
司机历史画像信息包括:过去预设天数内,所有推送给司机的预设类型订单中,司机参与抢单的次数的占比、过去预设天数司机参与抢单的订单其价格的分位数、司机预设天数完单收入和/或司机历史准点率。


4.根据权利要求1所述的方法,其特征在于,所述对关联后的数据进行预处理,包括:
若接单司机是新司机,则不存在历史画像信息,数据值为空;对于基础信息不做控制填充,用预设的缺失值模型进行处理;对于统计画像信息,用城市预设时间内的司机的画像信息平均值进行填充;或者,
通过贝叶斯平滑技术,获取用户或者司机在历史订单数据少的情况下的特征质量;或者,
样本不平衡处理,对所述负样本做降采样处理。


5.根据权利要求1所述的方法,其特征在于,所述对预处理后数据进行机器学习模型训练、评估和更新,包括:
结合模型效果、训练成本、可解释性、工程成本,选择预设模型作为所述的机器学习模型进行训练,并通过网格搜索方式确定模型超参数;
选择经典排序指标进行评估;
每隔第三预设时长内使用最新数据自动更新一版模型。

【专利技术属性】
技术研发人员:王德健周友茸周航
申请(专利权)人:深圳依时货拉拉科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1