一种数据处理方法及装置制造方法及图纸

技术编号:22723322 阅读:22 留言:0更新日期:2019-12-04 05:53
本说明书公开了一种数据处理方法及装置,首先获取目标数据的特征,再将目标数据的特征输入到预先训练的预估模型,得到目标数据在指定维度上的预估属性值以及预估误差值,然后根据预估误差值对预估属性值进行补偿,得到最终属性值,最后根据最终属性值,对目标数据进行处理,由于本说明书提供的数据处理方法对预估属性值进行了补偿,因此得到的最终属性值相比于现有技术更加接近实际属性值,有效地提高了最终属性值的准确性,从而根据最终属性值对目标数据的处理相比于现有技术更加准确高效。

A data processing method and device

The specification discloses a data processing method and device. First, obtain the characteristics of the target data, then input the characteristics of the target data into the pre-trained prediction model, obtain the estimated attribute value and the estimated error value of the target data in the specified dimension, then compensate the estimated attribute value according to the estimated error value, and finally obtain the final attribute value according to the final attribute value , process the target data. Because the data processing method provided in this manual compensates the estimated attribute value, the final attribute value obtained is closer to the actual attribute value than the existing technology, effectively improving the accuracy of the final attribute value, so the processing of the target data according to the final attribute value is more accurate and efficient than the existing technology.

【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及电子
,尤其涉及一种数据处理方法及装置。
技术介绍
当下,数据处理随处可见,通过处理有价值、有意义、准确性高的数据,进行某些特定的活动从而达到目的。在现有技术中,一种数据处理方法,是利用历史数据的特征训练模型,通过训练后的模型预估在某一维度上的预估属性值,根据预估属性值对数据进行处理,这些模型一般包括梯度迭代决策树(GradientBoostingDecisionTree,GBDT)或极端梯度提升(eXtremeGradientBoosting,XGBOOST)或神经网络等模型。然而,通过上述模型仅得到了数据的预估属性值,无法确定预估属性值的置信度,也无法确定预估属性值与实际的属性值之间的误差,从而无法确定准确的属性值。在实际应用中,由于无法得到准确的属性值而导致数据处理难以完成。以外卖订餐为例,从接收到外卖订单的时间到商户将餐品制作完成的时间为商户的供货准备时间。商户的供货准备时间是配送调度系统的重要参数之一,预估供货准备时间的准确性直接影响压单的结果和派单的效率。商户在不同时间段内的供货准备时间有所不同,一般情况下,闲时的供货准备时间较为固定,高峰时段的供货准备时间波动较大。无法准确地预估供货准备时间可能导致当配送员根据订单信息到达商户时,商户尚未完成餐品制作,配送员需要等待餐品制作,无法立即取餐安排配送,从而影响订单配送效率。
技术实现思路
本说明书实施例提供一种数据处理方法及装置,以部分的解决现有技术存在的上述问题。本说明书实施例采用下述技术方案:本说明书提供的一种数据处理方法,所述方法包括:获取目标数据的特征;将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;根据所述最终属性值,对所述目标数据进行处理。可选地,预先训练预估模型,包括:获取若干历史数据的特征;将所述历史数据的特征输入待训练的预估模型,得到所述历史数据在指定维度上的待优化预估属性值以及待优化预估误差值;根据所述待优化预估属性值以及所述历史数据在指定维度上的实际属性值,确定实际误差值;根据所述待优化预估误差值以及所述实际误差值,确定损失;以最小化损失为训练目标,对所述待训练的预估模型进行迭代训练。可选地,所述根据所述待优化预估误差值以及所述实际误差值,确定损失,包括:确定所述实际误差值的平方与所述待优化预估误差值的平方的比值;确定所述待优化预估误差值的平方的对数;根据所述比值与所述对数,确定损失。可选地,所述根据所述比值与所述对数,确定损失,包括:在预设的各系数中选择指定系数;确定所述指定系数与所述待优化预估误差值的乘积;确定所述比值、所述对数与所述乘积的和值,作为损失。可选地,所述在预设的各系数中选择指定系数,包括:针对预设的每个系数,确定该系数与所述待优化预估误差值的乘积,作为备选乘积,确定所述比值、所述对数与所述备选乘积的和值,作为备选损失,以最小化所述备选损失为训练目标,对所述待训练的预估模型进行指定次数的迭代训练,并确定训练后所述待训练的预估模型的准确度;根据针对每个系数确定出的准确度,在预设的各系数中,选择准确度最高的系数作为指定系数。可选地,所述根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值,包括:根据预设的各误差区间,确定所述预估误差值落入的误差区间;根据预设的各误差区间与各补偿权重的对应关系,确定所述预估误差值落入的误差区间对应的补偿权重;根据所述预估误差值和确定出的补偿权重,确定补偿值;将所述补偿值与所述预估属性值的和值,确定为最终属性值。可选地,所述目标数据包括:订单的数据;所述目标数据在指定维度上的属性值包括:所述订单对应的配送物提供方的供货准备时间;所述根据所述最终属性值,对所述目标数据进行处理,包括:根据所述订单对应的配送物提供方的最终供货准备时间,对所述订单进行调度规划。本说明书提供一种数据处理装置,所述装置包括:获取模块,用于获取目标数据的特征;预估模块,用于将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;补偿模块,用于根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;处理模块,用于根据所述最终属性值,对所述目标数据进行处理。本说明书提供一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的数据处理方法。本说明书提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述的数据处理方法。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:本说明书首先获取目标数据的特征,再将目标数据的特征输入到预先训练的预估模型,得到目标数据在指定维度上的预估属性值以及预估误差值,然后根据预估误差值对预估属性值进行补偿,得到最终属性值,最后根据最终属性值,对目标数据进行处理,由于本说明书提供的数据处理方法对预估属性值进行了补偿,因此得到的最终属性值相比于现有技术更加接近实际属性值,有效地提高了最终属性值的准确性,从而根据最终属性值对目标数据的处理相比于现有技术更加准确高效。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本说明书实施例提供的数据处理方法流程图;图2为本说明书实施例提供的一种补偿方法流程图;图3为本说明书实施例提供的预先训练预估模型流程图;图4为本说明书实施例提供的一种数据处理装置结构示意图;图5为本说明书实施例提供的对应于图1的电子设备示意图。具体实施方式为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。以下结合附图,详细说明本申请各实施例提供的技术方案。图1为本说明书实施例提供的数据处理方法流程图,具体可包括以下步骤:S100:获取目标数据的特征。在本说明书中,数据处理可应用于多种场景中,例如,在外卖配送场景中,商户的供货准备时间是配送调度系统的重要参数之一,供货准备时间是指从商户接收到外卖订单的时间到商户将餐品制作完成的时间,供货准备时间的准确性直接影响调度规划的结果以及订单的效率,服本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取目标数据的特征;/n将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;/n根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;/n根据所述最终属性值,对所述目标数据进行处理。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标数据的特征;
将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;
根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;
根据所述最终属性值,对所述目标数据进行处理。


2.如权利要求1所述的方法,其特征在于,预先训练预估模型,包括:
获取若干历史数据的特征;
将所述历史数据的特征输入待训练的预估模型,得到所述历史数据在指定维度上的待优化预估属性值以及待优化预估误差值;
根据所述待优化预估属性值以及所述历史数据在指定维度上的实际属性值,确定实际误差值;
根据所述待优化预估误差值以及所述实际误差值,确定损失;
以最小化损失为训练目标,对所述待训练的预估模型进行迭代训练。


3.如权利要求2所述的方法,其特征在于,所述根据所述待优化预估误差值以及所述实际误差值,确定损失,包括:
确定所述实际误差值的平方与所述待优化预估误差值的平方的比值;
确定所述待优化预估误差值的平方的对数;
根据所述比值与所述对数,确定损失。


4.如权利要求3所述的方法,其特征在于,所述根据所述比值与所述对数,确定损失,包括:
在预设的各系数中选择指定系数;
确定所述指定系数与所述待优化预估误差值的乘积;
确定所述比值、所述对数与所述乘积的和值,作为损失。


5.如权利要求4所述的方法,其特征在于,所述在预设的各系数中选择指定系数,包括:
针对预设的每个系数,确定该系数与所述待优化预估误差值的乘积,作为备选乘积,确定所述比值、所述对数与所述备选乘积的和值,作为备选损失,以最小化所述备选损失为训练目标,对所述待训练的预估模型进行指定次数的迭代...

【专利技术属性】
技术研发人员:周越李春苗
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1