数据处理方法和数据处理装置制造方法及图纸

技术编号:29404193 阅读:18 留言:0更新日期:2021-07-23 22:42
本发明专利技术实施例公开了一种数据处理方法和数据处理装置。本发明专利技术实施例获取包括历史任务的实际完成时长和实际处理时长在内的多个历史任务的任务信息后,基于上述多个历史任务的任务信息对预测模型进行训练,直至预测模型对应的实际完成时长的损失函数和实际处理时长的损失函数均收敛。其中,预测模型包括共享结构和非共享结构,非共享结构包括预测模型的第一输出层和第二输出层,且第一输出层以实际完成时长为训练目标,第二输出层以实际处理时长为训练目标。本发明专利技术实施例基于多个训练目标对预测模型同时进行训练,从而提升了模型的训练效率。

【技术实现步骤摘要】
数据处理方法和数据处理装置
本专利技术涉及计算机
,具体涉及一种数据处理方法和数据处理装置。
技术介绍
随着互联网和物流产业的不断普及,网购行业飞速发展,越来越多的人选择通过线上购物平台选购心仪的物品。对于物流配送行业,物品配送时长是影响用户满意度的重要因素,因此如何确定物品配送时长对于物流配送行业而言十分重要。物品配送任务往往包括多个环节,而现有的用于预测物品配送时长的模型的训练方式只能基于物品配送任务中某一个环节所消耗的时长对模型进行训练,因此上述训练方式对于模型的训练效率并不高。
技术实现思路
有鉴于此,本专利技术实施例目的在于提供一种数据处理方法和数据处理装置,用于通过多任务学习的方式对模型进行训练,从而提升模型的训练效率。第一方面,本专利技术实施例提供了一种数据处理方法,所述方法包括:获取任务信息集合,所述任务信息集合包括多个历史任务的历史任务信息,所述历史任务信息包括所述历史任务的实际完成时长和实际处理时长;基于所述历史任务信息,以所述实际完成时长和所述实际处理时长为训练目标对预测模型进行训练,直至所述预测模型的损失函数收敛,所述损失函数包括第一损失函数和第二损失函数,所述第一损失函数为所述实际完成时长对应的损失函数,所述第二损失函数为所述实际处理时长对应的损失函数;其中,所述预测模型包括共享结构和非共享结构,所述非共享结构为所述预测模型的输出层,所述非共享结构包括第一输出层和第二输出层,所述第一输出层以所述实际完成时长为训练目标,所述第二输出层以所述实际处理时长为训练目标。优选地,所述方法还包括:获取目标任务的目标任务信息;根据所述目标任务信息,基于所述预测模型,确定所述目标任务的预测完成时长和预测处理时长。优选地,所述第一输出层和所述第二输出层均为全连接层。优选地,所述预测模型为基于神经网络的因子分解机。优选地,所述第二损失函数为带有分位数的回归损失函数。第二方面,本专利技术实施例提供了一种数据处理装置,所述装置包括:第一信息获取单元,用于获取任务信息集合,所述任务信息集合包括多个历史任务的历史任务信息,所述历史任务信息包括所述历史任务的实际完成时长和实际处理时长;模型训练单元,用于基于所述历史任务信息,以所述实际完成时长和所述实际处理时长为训练目标对预测模型进行训练,直至所述预测模型的损失函数收敛,所述损失函数包括第一损失函数和第二损失函数,所述第一损失函数为所述实际完成时长对应的损失函数,所述第二损失函数为所述实际处理时长对应的损失函数;其中,所述预测模型包括共享结构和非共享结构,所述非共享结构为所述预测模型的输出层,所述非共享结构包括第一输出层和第二输出层,所述第一输出层以所述实际完成时长为训练目标,所述第二输出层以所述实际处理时长为训练目标。优选地,所述装置还包括:第二信息获取单元,用于获取目标任务的目标任务信息;时长预测单元,用于根据所述目标任务信息,基于所述预测模型,确定所述目标任务的预测完成时长和预测处理时长。优选地,所述第一输出层和所述第二输出层均为全连接层。第三方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面中任一项所述的方法。第四方面,本专利技术实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面中任一项所述的方法。本专利技术实施例获取包括历史任务的实际完成时长和实际处理时长在内的多个历史任务的任务信息后,基于上述多个历史任务的任务信息对预测模型进行训练,直至预测模型对应的实际完成时长的损失函数和实际处理时长的损失函数均收敛。其中,预测模型包括共享结构和非共享结构,非共享结构包括预测模型的第一输出层和第二输出层,且第一输出层以实际完成时长为训练目标,第二输出层以实际处理时长为训练目标。本专利技术实施例基于多个训练目标对预测模型同时进行训练,从而提升了模型的训练效率。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本专利技术第一实施例的数据处理方法的流程图;图2是本专利技术实施例的预测模型的结构示意图;图3是本专利技术第二实施例的数据处理装置的示意图;图4是本专利技术第三实施例的电子设备的示意图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。为了避免混淆本专利技术的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本专利技术实施例中,以历史任务和目标任务为外卖配送
为例进行说明,但是本领域技术人员容易理解,在历史任务和目标任务为其他物流配送任务,或者具有多个环节的任务时,本实施例的方法同样适用。物品配送任务往往包括多个环节。以外卖配送任务为例,外卖配送任务通常包括用户下单、商户接单、商品出餐、配送人员接单、配送人员取餐、配送人员送餐这几个环节,而现有的用于物品配送时长的模型的训练方法只能基于物品配送任务中某一个环节,例如在商户接单后,商品出餐这一环节消耗的时长对模型进行训练,不涉及同时基于其他几个环节所消耗的时长对模型进行训练,因此这种模型的训练方式的训练效率并不高。图1是本专利技术第一实施例的数据处理方法的流程图。如图1所示,本实施例的方法包括如下步骤:步骤S100,获取任务信息集合。用户在通过线上外卖平台订购外卖餐品发布外卖订单后,线上外卖平台会生成一个外卖物流配送任务,同时外卖订单的各项信息以及外卖物流配送任务中各个环节产生的数据,例如商户接单时刻、配送人员接单时刻等均会被发布到线上外卖平台,因此平台侧服务器(下述也即服务器)可以从线上外卖平台获取包括外卖订单的生成时刻(也即,用户的下单时刻)在内的外卖订单的订单信息,并将外卖订单的订单信息存储在数据库中。在本实施例中,服务器可以以预定周期(例如,每两周)从数据库中获取线上外卖平台在当前周期内产生的外卖订单的订单信息作为任务信息集合。任务信息集合用于进行多任务学习,也即用于训练预测模型。任务信息集合可以包括多个历史任务的历史任务信息,且历史任务信息至少包括历史任务的实际本文档来自技高网
...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取任务信息集合,所述任务信息集合包括多个历史任务的历史任务信息,所述历史任务信息包括所述历史任务的实际完成时长和实际处理时长;/n基于所述历史任务信息,以所述实际完成时长和所述实际处理时长为训练目标对预测模型进行训练,直至所述预测模型的损失函数收敛,所述损失函数包括第一损失函数和第二损失函数,所述第一损失函数为所述实际完成时长对应的损失函数,所述第二损失函数为所述实际处理时长对应的损失函数;/n其中,所述预测模型包括共享结构和非共享结构,所述非共享结构为所述预测模型的输出层,所述非共享结构包括第一输出层和第二输出层,所述第一输出层以所述实际完成时长为训练目标,所述第二输出层以所述实际处理时长为训练目标。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取任务信息集合,所述任务信息集合包括多个历史任务的历史任务信息,所述历史任务信息包括所述历史任务的实际完成时长和实际处理时长;
基于所述历史任务信息,以所述实际完成时长和所述实际处理时长为训练目标对预测模型进行训练,直至所述预测模型的损失函数收敛,所述损失函数包括第一损失函数和第二损失函数,所述第一损失函数为所述实际完成时长对应的损失函数,所述第二损失函数为所述实际处理时长对应的损失函数;
其中,所述预测模型包括共享结构和非共享结构,所述非共享结构为所述预测模型的输出层,所述非共享结构包括第一输出层和第二输出层,所述第一输出层以所述实际完成时长为训练目标,所述第二输出层以所述实际处理时长为训练目标。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取目标任务的目标任务信息;
根据所述目标任务信息,基于所述预测模型,确定所述目标任务的预测完成时长和预测处理时长。


3.根据权利要求1所述的方法,其特征在于,所述第一输出层和所述第二输出层均为全连接层。


4.根据权利要求1所述的方法,其特征在于,所述预测模型为基于神经网络的因子分解机。


5.根据权利要求1或4所述的方法,其特征在于,所述第二损失函数为带有分位数的回归损失函数。


6.一种数据处理装置,其特征在于,所述装置包括:
第一信息获取单元,用于获取任务信息集合,所述任务...

【专利技术属性】
技术研发人员:王星朱麟余维周凯荣王鹏宇许晓炜
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1