一种数据处理方法、模型建立方法、装置及电子设备制造方法及图纸

技术编号:25917120 阅读:38 留言:0更新日期:2020-10-13 10:36
本申请涉及一种数据处理方法、模型建立方法、装置及电子设备,属于计算机技术领域。该方法包括在需要预测参与促销定价的N个产品使收益最大化的最优参数组合时,获取影响收益最大化的决策因子,决策因子包括:目标置信度和决策变量,决策变量包括:N个产品各自的输入参数以及各自的参数变量;针对每一个产品,利用事先训练得到的预测模型,获得该产品在不同参数下的目标置信度的置信区间,其中,根据该产品的输入参数以及对应的参数变量得到该产品的不同参数;根据该产品在不同参数下的目标置信度的置信区间,确定该产品的最优参数,从而得到使收益最大化的N个产品的最优参数组合。通过该方法使得求解出的最优解更准确。

【技术实现步骤摘要】
一种数据处理方法、模型建立方法、装置及电子设备
本申请属于计算机
,具体涉及一种数据处理方法、模型建立方法、装置及电子设备。
技术介绍
促销活动是市场营销的基本策略之一,好的促销活动可以带来巨大的收益。随着人工智能的发展,越来越多的人工智能技术被应用到各领域的促销定价优化中。在现有的促销优化方案中,预测成交总额(GrossMerchandiseVolume,GMV)+优化求解是一种常见且有效的技术方案。该框架的原理为:利用机器学习模型预测某一库存量单位(StockKeepingUnit,SKU)在某一时间周期内的GMV,然后设定决策变量为广告、价格等促销方式,在某一SKU上的投入,利用优化算法,基于GMV预测模型,求解出针对每一SKU能使GMV最大化的最佳促销投放方式。现有的GMV预测或销量预测大多都是预测期望,对预测值高于真实值,和预测值低于真实值均给予同样的惩罚,即偏向预测平均值。但在实际场景中,往往更希望看到GMV预测值低于真实值(更希望实际产生的GMV高于提前的GMV预测值,而不是小于),即模型构建时应给予预测值高于真实值更多的惩罚,而不是给予同样的惩罚。
技术实现思路
鉴于此,本申请的目的在于提供一种数据处理方法、模型建立方法、装置及电子设备,以改善现有预测对预测值高于真实值以及预测值低于真实值均给予同样的惩罚,即偏向预测平均值,使得求解出的最优解不准确的问题。本申请的实施例是这样实现的:第一方面,本申请实施例提供了一种数据处理方法,包括:在需要预测参与促销定价的N个产品使收益最大化的最优参数组合时,获取影响收益最大化的决策因子,所述决策因子包括:目标置信度和决策变量,其中,所述决策变量包括:所述N个产品各自的输入参数以及各自的参数变量,N为大于1的整数;针对每一个产品,利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,其中,根据该产品的输入参数以及对应的参数变量得到该产品的不同参数;根据该产品在不同参数下的所述目标置信度的置信区间,确定该产品的最优参数,从而得到使收益最大化的所述N个产品的最优参数组合。本申请实施例中,通过获取影响收益最大化的决策因子,然后针对每一个产品,根据利用事先训练得到的预测模型,获得该产品在不同参数下的目标置信度的置信区间,进而确定该产品的最优参数,从而得到使收益最大化的所述N个产品的最优参数组合,在求解最优解时,会综合考虑置信度,置信区间以及GMV期望这三个维度,而不再是对预测值高于真实值以及预测值低于真实值均给予同样的惩罚,使得最终确定的最优解更准确。结合第一方面实施例的一种可能的实施方式,若N的值小于第一预设阈值,利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:利用事先构建的表征GMV期望与输入特征之间的线性关系的线性模型,预测该产品在不同参数下的GMV期望;根据预设置信区间公式、所述GMV期望,获得该产品在不同参数下的所述目标置信度的置信区间。本申请实施例中,当N的值小于第一预设阈值,也即数据量小时,采用线性模型来预测该产品在不同参数下的GMV期望,进而获得该产品在不同参数下的所述目标置信度的置信区间,以避免过度拟合,导致结果不准确。结合第一方面实施例的一种可能的实施方式,所述决策因子还包括:所述N个产品各自的历史GMV,若N的值不小于第一预设阈值,且所述N个产品的历史GMV分布符合正态分布或类似正态分布;利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:利用事先训练得到的销量预测模型,预测该产品在不同参数下的销量结果;根据预测的不同参数下的销量结果,得到对应的GMV期望;根据预设正态分布置信区间公式、所述GMV期望,获得该产品在不同参数下的所述目标置信度的置信区间。本申请实施例中,当决策因子还包括N个产品各自的历史GMV,若N的值不小于第一预设阈值,且N个产品的历史GMV分布符合正态分布或类似正态分布时,则利用事先训练得到的销量预测模型,预测该产品在不同参数下的销量结果,进而便可快速准确的获得不同参数下的GMV期望,从而得到不同参数下的目标置信度的置信区间。结合第一方面实施例的一种可能的实施方式,所述决策因子还包括:所述N个产品各自的历史GMV,若N的值不小于第一预设阈值,且所述N个产品的历史GMV分布不符合正态分布或类似正态分布;利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:从预设分位点模型库中选取出与所述目标置信度对应的第一分位点预测模型和第二分位点预测模型;分别利用所述第一分位点预测模型和所述第二分位点预测模型,预测该产品在不同参数下的GMV期望;针对该产品的每一参数,根据该参数下的所述第一分位点预测模型预测的GMV期望、所述第二分位点预测模型预测的GMV期望,得到该参数下的所述目标置信度的置信区间,从而得到该产品在不同参数下的所述目标置信度的置信区间。本申请实施例中,当决策因子还包括N个产品各自的历史GMV,若N的值不小于第一预设阈值,且N个产品的历史GMV分布不符合正态分布或类似正态分布时,则获取该目标置信度对应的2个分位点预测模型,然后利用这2个分位点预测模型分别预测该产品在不同参数下的GMV期望,从而得到该产品在不同参数下的目标置信度的置信区间,通过利用分位点来平衡高估和低估的不同惩罚系数,这样在实际当中就不会出现GMV很高而ROI较低的情况,使得求解出的最优参数更准确。结合第一方面实施例的一种可能的实施方式,在利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间之前,所述方法还包括:获取样本数据,所述样本数据包括M个产品各自与销量相关的原始数据,所述原始数据包括历史GMV,其中,M为正整数,且M大于N;若样本数M小于第二预设阈值,则利用所述样本数据,构建表征GMV期望与输入特征之间的线性关系的线性模型;若所述样本数M不小于所述第二预设阈值,判断所述M个产品的历史GMV分布是否符合正态分布或类似正态分布;在为是时,则利用所述样本数据构建销量预测模型;在为否时,则利用所述样本数据、不同的损失函数,构建不同分位点下的GMV预测模型。本申请实施例中,针对不同的数据规模(N的数值大小)以及不同的GMV分布假设(N个产品的历史GMV分布情况),提出不同的GMV分布预测方法,进而在计算各个产品在不同参数下的目标置信度的置信区间时所选用的预测模型不同,进行有针对性的区别,以保证最终获得的各个产品的最优参数尽可能的准确。第二方面,本申请实施例还提供了一种模型建立方法,包括:获取样本数据,所述样本数据包括M个产品各自与销量相关的原始数据,所述原始数据包括历史GMV,其中,M为正整数;判断样本数M是否小于预设阈值;在为是时,利用所述样本数据,构建表征GMV期望与输入特征之间的线性关系的线性模型。结合第二方面实施例的一种可能的实施方式,在判断样本数M是否小于预设阈值之后,所述方法还包括:在所述样本数M不小于所述预设阈值时,若所述M个产品的历史GMV分布符合正本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n在需要预测参与促销定价的N个产品使收益最大化的最优参数组合时,获取影响收益最大化的决策因子,所述决策因子包括:目标置信度和决策变量,其中,所述决策变量包括:所述N个产品各自的输入参数以及各自的参数变量,N为大于1的整数;/n针对每一个产品,利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,其中,根据该产品的输入参数以及对应的参数变量得到该产品的不同参数;/n根据该产品在不同参数下的所述目标置信度的置信区间,确定该产品的最优参数,从而得到使收益最大化的所述N个产品的最优参数组合。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
在需要预测参与促销定价的N个产品使收益最大化的最优参数组合时,获取影响收益最大化的决策因子,所述决策因子包括:目标置信度和决策变量,其中,所述决策变量包括:所述N个产品各自的输入参数以及各自的参数变量,N为大于1的整数;
针对每一个产品,利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,其中,根据该产品的输入参数以及对应的参数变量得到该产品的不同参数;
根据该产品在不同参数下的所述目标置信度的置信区间,确定该产品的最优参数,从而得到使收益最大化的所述N个产品的最优参数组合。


2.根据权利要求1所述的方法,其特征在于,若N的值小于第一预设阈值,利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:
利用事先构建的表征GMV期望与输入特征之间的线性关系的线性模型,预测该产品在不同参数下的GMV期望;
根据预设置信区间公式、所述GMV期望,获得该产品在不同参数下的所述目标置信度的置信区间。


3.根据权利要求1所述的方法,其特征在于,所述决策因子还包括:所述N个产品各自的历史GMV,若N的值不小于第一预设阈值,且所述N个产品的历史GMV分布符合正态分布或类似正态分布;利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:
利用事先训练得到的销量预测模型,预测该产品在不同参数下的销量结果;
根据预测的不同参数下的销量结果,得到对应的GMV期望;
根据预设正态分布置信区间公式、所述GMV期望,获得该产品在不同参数下的所述目标置信度的置信区间。


4.根据权利要求1所述的方法,其特征在于,所述决策因子还包括:所述N个产品各自的历史GMV,若N的值不小于第一预设阈值,且所述N个产品的历史GMV分布不符合正态分布或类似正态分布;利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间,包括:
从预设分位点模型库中选取出与所述目标置信度对应的第一分位点预测模型和第二分位点预测模型;
分别利用所述第一分位点预测模型和所述第二分位点预测模型,预测该产品在不同参数下的GMV期望;
针对该产品的每一参数,根据该参数下的所述第一分位点预测模型预测的GMV期望、所述第二分位点预测模型预测的GMV期望,得到该参数下的所述目标置信度的置信区间,从而得到该产品在不同参数下的所述目标置信度的置信区间。


5.根据权利要求1所述的方法,其特征在于,在利用事先训练得到的预测模型,获得该产品在不同参数下的所述目标置信度的置信区间之前,所述方法还包...

【专利技术属性】
技术研发人员:周鹏程崔燕达张发恩
申请(专利权)人:创新奇智北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1