配送时长调整方法、装置及电子设备制造方法及图纸

技术编号:33133527 阅读:23 留言:0更新日期:2022-04-17 00:55
本申请实施例提供了一种配送时长调整方法、装置、电子设备及计算机可读存储介质,涉及计算机领域。本申请实施例实现了基于强化学习模型,并根据目标订单的订单参数信息的特征,预测目标订单的第一预估配送时长对应的目标调整信息,由于预设调整模型在预测过程中,充分利用目标订单的相关订单参数信息,结合目标订单的订单参数信息的特征,对第一预估配送时长进行调整,提升配送时长预测的准确率。提升配送时长预测的准确率。提升配送时长预测的准确率。

【技术实现步骤摘要】
配送时长调整方法、装置及电子设备


[0001]本申请涉及计算机
,具体而言,本申请涉及一种配送时长调整方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着互联网技术的不断发展,线上订购商品的购买方式逐步成为大众的新选择。在线上订购商品的消费方式中,对订购的商品进行即时配送给用户带来了便捷的消费体验。
[0003]在线上订购商品等场景中,购物平台在接收到用户通过客户端下单购买商品的订单后,可以根据订单的相关信息(例如备货时长、订单距离等信息)确定预估订单配送时长。由于预估配送时长是基于订单的相关信息估测的配送时长,预估配送时长难免存在准确性的问题。在相关技术中,可以对预估配送时长进行调整,以保证向用户展示的更为准确配送时长。然而,相关技术中,调整后的预估配送时长的准确率较低。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是预估配送时长准确率低的技术缺陷。
[0005]根据本申请的一个方面,提供了一种配送时长调整方法,该方法包括:获取目标订单的订单参数信息以及第一预估配送时长;
[0006]将所述订单参数信息及所述第一预估配送时长输入至预设调整模型,得到每个预设的候选调整信息对应的第一权重值;所述第一权重值指示每个所述候选调整信息对应的概率;
[0007]其中,所述候选调整信息包括第一调整操作以及所述第一调整操作的操作时长;所述第一调整操作包括针对所述第一预估配送时长的加时操作或减时操作;所述预设调整模型为对训练样本集进行强化学习得到的;
[0008]基于所述第一权重值以及所述候选调整信息,确定目标调整信息。
[0009]可选的,所述获取目标订单的订单参数信息以及第一预估配送时长之前,所述方法包括:
[0010]获取训练样本集;其中,所述训练样本集中包括样本订单的:样本订单参数信息、样本预估配送时长、样本实际配送时长;
[0011]针对每个所述样本订单,将所述样本订单参数信息、样本预估配送时长输入初始训练模型中,得到每个所述候选调整信息的预测权重值;
[0012]根据所述预测权重值以及所述样本实际配送时长,确定执行所述候选调整操作后的所述样本订单的第一配送准确率;
[0013]根据所述第一配送准确率,确定训练损失值;
[0014]基于所述样本订单信息以及所述样本订单对应的训练损失值,对所述神经网络模
型进行重复训练,直至得到符合训练结束条件的所述预设调整模型。
[0015]可选的,所述根据所述第一配送准确率,确定训练损失值,包括:
[0016]所述针对每个所述样本订单,根据所述样本订单的第一配送准确率以及所述样本订单的实际配送准确率,确定准确率提升值,其中,所述样本订单的实际配送准确率为根据所述样本订单的样本实际配送时长确定的;
[0017]基于所述准确率提升值以及修正值,确定所述训练损失值,所述修正值为根据预测调整信息与第一预设调整信息之间的关系确定,所述预测调整信息为根据每个所述候选调整信息及其对应的预测权重值确定。
[0018]可选的,所述训练损失值对应的数据关系如下:
[0019][0020]其中,L(θ|s)表示所述训练损失值,表示x的梯度值;E(x)表示x的期望值;
[0021]S表示所述样本订单,A表示所述候选调整信息的集合,
[0022]pθ(A|s)表示S执行A中每个所述候选调整信息的概率;
[0023]r(A)表示所述第一配送准确率;
[0024]b(s)表示所述实际配送准确率;
[0025]λ*l(A)表示所述修正值,λ表示预设调整强度系数,
[0026]l(A)表示修正项,l(A)=max((t(A)

t
u
),0)+max(

(t(A)

t
l
),0),t(A)表示所述预测调整信息的预测调整时长,[t
l
,t
u
]表示所述第一预设调整信息的预设调整时长区间。
[0027]可选的,所述订单参数信息包括以下至少一项:
[0028]阻塞订单数量;
[0029]订单预估备货时长;
[0030]订单历史平均备货时长;
[0031]订单配送距离;
[0032]订单历史平均配送时长。
[0033]可选的,所述方法还包括:
[0034]根据所述第一预估配送时长以及所述目标调整信息,确定第二预估配送时长;
[0035]向客户端发送所述第二预估配送时长,指示所述客户端在用户界面显示所述第二预估配送时长。
[0036]可选的,所述基于所述第一权重值以及所述候选调整信息,确定目标调整信息,包括以下至少一项:
[0037]确定对应的所述第一权重值最大的候选调整信息作为所述目标调整信息;
[0038]根据每个所述候选调整信息及其分别对应的第一权重值,对每个所述第一调整操作的操作时长进行加权处理,得到所述目标调整信息。
[0039]根据本申请的一个方面,提供了一种配送时长调整方法,该方法包括:接收服务器发送的第二预估配送时长,所述第二预估配送时长为根据第一预估配送时长以及目标调整信息确定,所述目标调整信息基于各个候选调整信息及其分别对应的第一权重值确定,各个候选调整信息对应的第一权重值是基于订单参数信息及所述第一预估配送时长,通过预设调整模型确定的;
[0040]其中,所述第一权重值指示每个所述候选调整信息对应的概率;
[0041]所述候选调整信息包括第一调整操作以及所述第一调整操作的操作时长;所述第一调整操作包括针对所述第一预估配送时长的加时操作或减时操作;所述预设调整模型为对训练样本集进行机器学习得到的;
[0042]在用户界面显示所述第二预估配送时长。
[0043]根据本申请的另一个方面,提供了一种配送时长调整装置,该装置包括:
[0044]获取模块,用于获取目标订单的订单参数信息以及第一预估配送时长;
[0045]预测模块,用于将所述订单参数信息及所述第一预估配送时长输入至预设调整模型,得到每个预设的候选调整信息对应的第一权重值;所述第一权重值指示每个所述候选调整信息对应的概率;
[0046]其中,所述候选调整信息包括第一调整操作以及所述第一调整操作的操作时长;所述第一调整操作包括针对所述第一预估配送时长的加时操作或减时操作;所述预设调整模型为对训练样本集进行强化学习得到的;
[0047]确定模块,用于基于所述第一权重值以及所述候选调整信息,确定目标调整信息。
[0048]根据本申请的另一个方面,提供了一种配送时长调整装置,该装置包括:
[0049]接收模块,用于接收服务器发送的第二预估配送时长,所述第二预估配送时长为根据第一预估配送时长以及目标调整信息确定,所述目标调整信息基于各个候选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种配送时长调整方法,其特征在于,包括:获取目标订单的订单参数信息以及第一预估配送时长;将所述订单参数信息及所述第一预估配送时长输入至预设调整模型,得到每个预设的候选调整信息对应的第一权重值;所述第一权重值指示每个所述候选调整信息对应的概率;其中,所述候选调整信息包括第一调整操作以及所述第一调整操作的操作时长;所述第一调整操作包括针对所述第一预估配送时长的加时操作或减时操作;所述预设调整模型为对训练样本集进行强化学习得到的;基于所述第一权重值以及所述候选调整信息,确定目标调整信息。2.根据权利要求1所述的配送时长调整方法,其特征在于,所述获取目标订单的订单参数信息以及第一预估配送时长之前,所述方法包括:获取训练样本集;其中,所述训练样本集中包括样本订单的:样本订单参数信息、样本预估配送时长、样本实际配送时长;针对每个所述样本订单,将所述样本订单参数信息、样本预估配送时长输入初始训练模型中,得到每个所述候选调整信息的预测权重值;根据所述预测权重值以及所述样本实际配送时长,确定执行所述候选调整操作后的所述样本订单的第一配送准确率;根据所述第一配送准确率,确定训练损失值;基于所述样本订单信息以及所述样本订单对应的训练损失值,对所述神经网络模型进行重复训练,直至得到符合训练结束条件的所述预设调整模型。3.根据权利要求2所述的配送时长调整方法,其特征在于,所述根据所述第一配送准确率,确定训练损失值,包括:所述针对每个所述样本订单,根据所述样本订单的第一配送准确率以及所述样本订单的实际配送准确率,确定准确率提升值,其中,所述样本订单的实际配送准确率为根据所述样本订单的样本实际配送时长确定的;基于所述准确率提升值以及修正值,确定所述训练损失值,所述修正值为根据预测调整信息与第一预设调整信息之间的关系确定,所述预测调整信息为根据每个所述候选调整信息及其对应的预测权重值确定。4.根据权利要求3所述的配送时长调整方法,其特征在于,所述训练损失值对应的数据关系如下:其中,L(θ|s)表示所述训练损失值,表示x的梯度值;E(x)表示x的期望值;S表示所述样本订单,A表示所述候选调整信息的集合,pθ(A|s)表示S执行A中每个所述候选调整信息的概率;r(A)表示所述第一配送准确率;b(s)表示所述实际配送准确率;λ*l(A)表示所述修正值,λ表示预设调整强度系数,l(A)表示修正项,l(A)=max((t(A)

t
u
),0)+max(

(t(A)

t
l
),0),t(A)表示所述预测调
整信息的预测调整时长,[t
l
,t
u
]表示所述第一预设调整信息的预设调整时长区间。5.根据权利要求1所述的配送时长调整方法,其特征在于,所述方法还包括:根据所...

【专利技术属性】
技术研发人员:王星朱麟高兴兴
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1