大数据环境下在线零售商的需求模型构建及需求预测方法技术

技术编号:33546167 阅读:62 留言:0更新日期:2022-05-26 22:40
本发明专利技术属于供应链需求预测领域,具体涉及一种大数据环境下在线零售商的需求模型构建及需求预测方法,包括:基于历史数据样本集统计每个零售商对每个商品的需求统计量;根据需求统计量对各零售商

【技术实现步骤摘要】
大数据环境下在线零售商的需求模型构建及需求预测方法


[0001]本专利技术属于供应链需求预测领域,更具体地,涉及一种大数据环境下在线零售商的需求模型构建及需求预测方法。

技术介绍

[0002]随着电商的发展,为提高电商物流的时效性,电商平台纷纷建立了以实体门店为主的前置仓模式,通过对消费者的需求进行预测,提前将对应商品发送至前置仓门店,当消费者下单时,系统选择距离消费者较近的前置仓门店,将商品配送至目标地址,从而有效缩短商品与消费者的距离,降低物流配送时间。若预测中的商品未被购买,则会产生转运、存储、退回等费用,增加了供应链整体的运作成本。因此,前置仓模式的实现对供应链需求预测提出了更高的要求。在大数据和信息处理技术快速发展的新时代背景下,运用大数据分析技术,对前置仓门店的需求进行准确预测,可以为前置仓门店的“预判发货”提供决策支持。
[0003]当前大数据环境下,电商平台产生了大量客户点击、浏览、加入购物车等行为数据,以及商品销售量、退货量等数据信息,如何利用大量历史消费数据信息预测消费者需求成为业界和学术界研究的焦点问题,而现有已公开的需求预测方法主要是针对电商平台提供的数据建立整体的预测模型,以此方式建立的模型不能适应不同商家中不同产品的需求特点,预测精度不高。

技术实现思路

[0004]本专利技术提供一种大数据环境下在线零售商的需求模型构建及需求预测方法,用以解决现有电商需求预测方法对不同商家对于不同商品的需求预测精度不高的技术问题。
[0005]本专利技术解决上述技术问题的技术方案如下:一种大数据环境下在线零售商的需求模型构建方法,包括:
[0006]基于历史数据样本集,统计每个零售商对每个商品的按时间粒度的需求统计量;并根据所述需求统计量,对各零售商ID和各商品ID构成的组进行聚类;每个历史数据样本包括:零售商ID,商品ID,消费者ID,一次对该商品购买量,一次对该商品退货量,以及对该商品的需求量信息;
[0007]对任一聚类簇所对应的历史数据样本集按照周期划分,取每相邻多个周期的数据为一组数据;其中,从该相邻多个周期的数据中最后一个周期数据中提取各客户在各零售商购买各商品的需求标签值,从其他周期数据中提取各客户在各零售商购买各商品的需求特征,构成多个训练样本;
[0008]采用每一聚类簇的所有训练样本训练得到该聚类簇的需求预测模型。
[0009]本专利技术的有益效果是:本专利技术提出了一种大数据环境下基于市场细分的供应链需求预测方法,具体的,主要通过消费者在某一商店对某一产品的购买量、消费金额、退货量、商品信息以及商家信息等数据进行预处理和提取特征,然后根据需求特点对商家-产品进
行分组划分,完成聚类,分析其中隐含的不同需求模式,进一步针对不同组的商家-产品分别建立相应的需求预测模型,缩小了后续预测模型处理的数据量,减少了数据处理的时间,同时提高对未来一段时间各商家的需求量进行准确预测,为供应商向各前置仓门店“预判发货”提供技术支持。
[0010]上述技术方案的基础上,本专利技术还可以做如下改进。
[0011]进一步,所述对该商品的需求量信息为对该商品的需求量的对数值。
[0012]本专利技术的进一步有益效果是:采用需求量的对数值,提高预测精度。
[0013]进一步,采用SOM和层次聚类法进行所述聚类。
[0014]进一步,所述需求特征包括时序统计特征,所述时序统计特征包含:零售商对商品的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率;商品的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率;零售商的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率。
[0015]本专利技术的进一步有益效果是:通过这些时序特征描述了关于各种商品、各个零售商和某一零售商中某一产品历史需求情况,以及历史退货情况,为准确预测产品需求奠定基础。
[0016]进一步,采用GBDT模型,对每个训练样本中各特征进行重要度排序,在每个训练样本中保留重要度高的特征。
[0017]本专利技术的进一步有益效果是:该过程实现了特征选择,去除了对后续预测影响较小或无影响的特征,进而提高预测的效果和预测阶段的运行速度。
[0018]进一步,采用每一聚类簇的所有训练样本训练得到该聚类簇的需求预测模型,具体为:采用每一个聚类簇的所有训练样本训练多个模型,选择预测精度较高的模型作为该聚类簇的预测模型,其中,所述多个模型包括XGBoost、Lasso Regression、ElasticNet和ANN。
[0019]进一步,所述选择预测精度较高的模型,具体为:通过MSE、MAE和R-squared评价指标选择预测精度较高的算法模型。
[0020]本专利技术还提供一种大数据环境下在线零售商的需求预测方法,包括:
[0021]基于待预测的零售商ID和商品ID所对应的历史数据,统计该零售商对该商品的按时间粒度的需求统计量,所述历史数据包括:零售商ID,商品ID,消费者ID,一次对该商品购买量,一次对该商品退货量,以及对该商品的需求量信息;
[0022]根据如上所述的一种大数据环境下在线零售商的需求模型构建方法中所述的聚类簇,判断待预测的零售商ID和商品ID所在的聚类簇,并选择该聚类所对应的需求预测模型进行需求预测。
[0023]本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行如上所述的一种大数据环境下在线零售商的需求模型构建方法和/或如上所述的一种大数据环境下在线零售商的需求预测方法。
附图说明
[0024]图1为本专利技术实施例提供的一种大数据环境下在线零售商的需求模型构建方法流程框图;
[0025]图2为本专利技术实施例提供的一种大数据环境下在线零售商的需求模型构建方法中商家-产品的聚类划分流程图;
[0026]图3为本专利技术实施例提供的另一种大数据环境下在线零售商的需求模型构建方法流程框图;
[0027]图4为本专利技术实施例提供的一种大数据环境下在线零售商的需求模型构建方法中针对不同商家-产品组的需求预测模型构建流程框图。
具体实施方式
[0028]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0029]实施例一
[0030]一种大数据环境下在线零售商的需求模型构建方法100,如图1所示,包括:
[0031]S110、基于历史数据样本集,统计每个零售商对每个商品的按时间粒度的需求统计量;并根据需求统计量,对各零售商ID和各商品ID构成的组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据环境下在线零售商的需求模型构建方法,其特征在于,包括:基于历史数据样本集,统计每个零售商对每个商品的按时间粒度的需求统计量;并根据所述需求统计量,对各零售商ID和各商品ID构成的组进行聚类;每个历史数据样本包括:零售商ID,商品ID,消费者ID,一次对该商品购买量,一次对该商品退货量,以及对该商品的需求量信息;对任一聚类簇所对应的历史数据样本集按照周期划分,取每相邻多个周期的数据为一组数据;其中,从该相邻多个周期的数据中最后一个周期数据中提取各客户在各零售商购买各商品的需求标签值,从其他周期数据中提取各客户在各零售商购买各商品的需求特征,构成多个训练样本;采用每一聚类簇的所有训练样本训练得到该聚类簇的需求预测模型。2.根据权利要求1所述的一种大数据环境下在线零售商的需求模型构建方法,其特征在于,所述对该商品的需求量信息为对该商品的需求量的对数值。3.根据权利要求1所述的一种大数据环境下在线零售商的需求模型构建方法,其特征在于,采用SOM和层次聚类法进行所述聚类。4.根据权利要求1所述的一种大数据环境下在线零售商的需求模型构建方法,其特征在于,所述需求特征包括时序统计特征,所述时序统计特征包含:零售商对商品的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率;商品的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率;零售商的需求量均值、方差、最大值和最小值,退货量的均值、方差、最大值和最小值,退货次数,以及退货比率。5.根据权利要求1所述的一种大数据环境下在线零售商的需求模型构建方法,其特征...

【专利技术属性】
技术研发人员:徐贤浩任欣欣
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1