一种数据分析方法和装置制造方法及图纸

技术编号:23213518 阅读:23 留言:0更新日期:2020-01-31 22:08
本发明专利技术公开了一种数据分析方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比;根据往期目标物品在所属品类的销售指标占比预测目标时间段内目标物品在所属品类的销售指标占比;根据目标时间段内的总销售指标、目标物品所属品类的品类占比以及目标物品在所属品类的销售指标占比预测目标物品的销售指标。该实施方式把对销售指标的直接预测转换成对物品所属品类的品类占比预测,大大提高预测结果的准确性,从而指导促销期提前准确备货。

A data analysis method and device

【技术实现步骤摘要】
一种数据分析方法和装置
本专利技术涉及计算机
,尤其涉及一种数据分析方法和装置。
技术介绍
基于目前大型零售行业多品类、多促销问题。促销本身的特性中包含很大的不确定性,规律性较低,导致销售指标的预测难度较大。现有技术的预测方法主要是直接预测销售指标,例如直接预测某物品的销量,在重大促销场景下,这种预测方法是失效的,准确性低。与此同时,零售行业需要提前备货,这就形成了提前备货与预测不准确的矛盾点。为了更准确的提前备货,需要一种有效的预测方法来解决此问题。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据分析方法和装置,把对销售指标的直接预测转换成对物品所属品类的品类占比预测,用户对不同品类的购买占比在不同年份是变化不大的,问题就从预测绝对量变成预测相对量,大大提高预测结果的准确性,从而指导促销期提前准确备货。根据本专利技术实施例的一个方面,提供了一种数据分析方法。根据本专利技术实施例的数据分析方法包括:根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;>根据往期目标物品所本文档来自技高网...

【技术保护点】
1.一种数据分析方法,其特征在于,包括:/n根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;/n根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比;/n根据往期目标物品在所属品类的销售指标占比预测目标时间段内目标物品在所属品类的销售指标占比;/n根据目标时间段内的总销售指标、目标物品所属品类的品类占比以及目标物品在所属品类的销售指标占比预测目标物品的销售指标。/n

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:
根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;
根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比;
根据往期目标物品在所属品类的销售指标占比预测目标时间段内目标物品在所属品类的销售指标占比;
根据目标时间段内的总销售指标、目标物品所属品类的品类占比以及目标物品在所属品类的销售指标占比预测目标物品的销售指标。


2.如权利要求1所述的方法,其特征在于,根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标,包括:根据往期多个时间段内所有物品的总销售指标,按照如下预测公式预测目标时间段内所有物品的理论总销售指标,根据理论总销售指标预测目标时间段内所有物品的总销售指标:



式中,ordern表示目标时间段内所有物品的理论总销售指标;M表示往期的时间段数量,1≤M≤n-1;ordern-m表示第(n-m)个时间段内所有物品的总销售指标;αn-m表示第(n-m)个时间段内所有物品的总销售指标的权重;ε1表示预测偏差。


3.如权利要求2所述的方法,其特征在于,根据理论总销售指标预测目标时间段内所有物品的总销售指标,包括:根据理论总销售指标,按照如下修正公式预测目标时间段内所有物品的总销售指标:
order=ω1×ordern+ω2×μ×ordern-1
式中,order表示目标时间段内所有物品的总销售指标;μ表示预设的增幅比例,μ×ordern-1表示增幅量;ω1表示理论总销售指标的权重;ω2表示增幅量的权重。


4.如权利要求1所述的方法,其特征在于,根据往期目标物品所属品类的品类占比预测目标时间段内目标物品所属品类的品类占比,包括:
选取多个时间窗口,以各个时间窗口内多个品类的品类占比训练时序模型和GBRT模型;将训练好的时序模型和GBRT模型融合得到品类预测模型;以各个时间窗口内目标物品所属品类的品类占比作为输入,利用品类预测模型预测目标时间段内目标物品所属品类的品类占比。


5.如权利要求4所述的方法,其特征在于,品类预测模型为:



式中,y表示目标时间段内目标物品所属品类的品类占比;rhw表示时序模型预测的目标时间段内目标物品所属品类的品类占比,rgbrt表示GBRT模型预测的目标时间段内目标物品所属品类的品类占比;表示rhw的修正系数,表示rgbrt的修正系数;β1表示rhw的权重,β2表示rgbrt的权重,ε2表示品类预测模型的预测偏差。


6.如权利要求5所述的方法,其特征在于,和的取值满足如下条件:



式中,Sy表示第y个样本的真实值,B表示样本量,Q表示预设的阈值。


7.如权利要求4所述的方法,其特征在于,以各个时间窗口内多个品类的品类占比训练时序模型和GBRT模型之前,还包括:确认该所述多个时间窗口满足如下条件:



式中,xij为第i个品类在第j个时间窗口内的品类占比,为一组时间序列;σ,μ分别为第i个品类在各个时间窗口内的品类占比的标准差和均值;A为时间窗口的数量;γ,θ为弹性系数;I为示性函数,xij≤μ+θσ时I=0、xij>μ+θσ时I=1;P表示概率。


8.如权利要求7所述的方法,其特征在于,还包括:确定第i个品类在各个时间窗口内的品类占比,然后对得到的各个品类占比进行数据清洗,以数据清洗后的各个品类占比确定第i个品类在各个时间窗口内的品类占比的标准差和均值。


9.一种数据分析装置,其特征在于,包括:
总销售指标预测模块,根据往期所有物品的总销售指标预测目标时间段内所有物品的总销售指标;
品类占比预测模块,根据往期...

【专利技术属性】
技术研发人员:王鑫
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1