The specification discloses a data processing method and device. First, obtain the characteristics of the target data, then input the characteristics of the target data into the pre-trained prediction model, obtain the estimated attribute value and the estimated error value of the target data in the specified dimension, then compensate the estimated attribute value according to the estimated error value, and finally obtain the final attribute value according to the final attribute value , process the target data. Because the data processing method provided in this manual compensates the estimated attribute value, the final attribute value obtained is closer to the actual attribute value than the existing technology, effectively improving the accuracy of the final attribute value, so the processing of the target data according to the final attribute value is more accurate and efficient than the existing technology.
【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及电子
,尤其涉及一种数据处理方法及装置。
技术介绍
当下,数据处理随处可见,通过处理有价值、有意义、准确性高的数据,进行某些特定的活动从而达到目的。在现有技术中,一种数据处理方法,是利用历史数据的特征训练模型,通过训练后的模型预估在某一维度上的预估属性值,根据预估属性值对数据进行处理,这些模型一般包括梯度迭代决策树(GradientBoostingDecisionTree,GBDT)或极端梯度提升(eXtremeGradientBoosting,XGBOOST)或神经网络等模型。然而,通过上述模型仅得到了数据的预估属性值,无法确定预估属性值的置信度,也无法确定预估属性值与实际的属性值之间的误差,从而无法确定准确的属性值。在实际应用中,由于无法得到准确的属性值而导致数据处理难以完成。以外卖订餐为例,从接收到外卖订单的时间到商户将餐品制作完成的时间为商户的供货准备时间。商户的供货准备时间是配送调度系统的重要参数之一,预估供货准备时间的准确性直接影响压单的结果和派单的效率。商户在不同时间段内的供货准备时间有所不同,一般情况下,闲时的供货准备时间较为固定,高峰时段的供货准备时间波动较大。无法准确地预估供货准备时间可能导致当配送员根据订单信息到达商户时,商户尚未完成餐品制作,配送员需要等待餐品制作,无法立即取餐安排配送,从而影响订单配送效率。
技术实现思路
本说明书实施例提供一种数据处理方法及装置,以部分的解决现有技术存在的上述问题。本 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取目标数据的特征;/n将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;/n根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;/n根据所述最终属性值,对所述目标数据进行处理。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取目标数据的特征;
将所述目标数据的特征输入预估模型,得到所述目标数据在指定维度上的预估属性值以及预估误差值;
根据所述预估误差值对所述预估属性值进行补偿,得到最终属性值;
根据所述最终属性值,对所述目标数据进行处理。
2.如权利要求1所述的方法,其特征在于,预先训练预估模型,包括:
获取若干历史数据的特征;
将所述历史数据的特征输入待训练的预估模型,得到所述历史数据在指定维度上的待优化预估属性值以及待优化预估误差值;
根据所述待优化预估属性值以及所述历史数据在指定维度上的实际属性值,确定实际误差值;
根据所述待优化预估误差值以及所述实际误差值,确定损失;
以最小化损失为训练目标,对所述待训练的预估模型进行迭代训练。
3.如权利要求2所述的方法,其特征在于,所述根据所述待优化预估误差值以及所述实际误差值,确定损失,包括:
确定所述实际误差值的平方与所述待优化预估误差值的平方的比值;
确定所述待优化预估误差值的平方的对数;
根据所述比值与所述对数,确定损失。
4.如权利要求3所述的方法,其特征在于,所述根据所述比值与所述对数,确定损失,包括:
在预设的各系数中选择指定系数;
确定所述指定系数与所述待优化预估误差值的乘积;
确定所述比值、所述对数与所述乘积的和值,作为损失。
5.如权利要求4所述的方法,其特征在于,所述在预设的各系数中选择指定系数,包括:
针对预设的每个系数,确定该系数与所述待优化预估误差值的乘积,作为备选乘积,确定所述比值、所述对数与所述备选乘积的和值,作为备选损失,以最小化所述备选损失为训练目标,对所述待训练的预估模型进行指定次数的迭代...
【专利技术属性】
技术研发人员:周越,李春苗,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。