【技术实现步骤摘要】
基于间断时间序列样本构建的销量预测模型及构建方法
[0001]本专利技术涉及计算机及大数据处理
,尤其是涉及一种基于间断时间序列样本构建的销量预测模型及构建方法。
技术介绍
[0002]在市场竞争日益白热化的今天,精细化运营、降本提效是大势所趋,而对毛利率本身就不算很高的零售行业来说,更是重中之重。销量预测是零售行业内进行精细化运营、降本提效的主要手段。销量预测主要是通过商品过去一段时间内的销量记录,来预测商品在未来某个时间的销量。帮助零售企业减少不必要的库存资金占用、或减少因库存不足而带来的销售亏损。
[0003]零售企业需要对在架售卖的多种商品进行销量预测,但不同商品的销量波动有比较大的差异,某些商品仅在部分时间段内有销量(例如:烟花爆竹在春节期间销量大幅度增加;冰淇淋在夏天销量会大幅度增加等情况)。根据零售商品销售的二八原则(20%的商品贡献了80%的销量),可以的得出80%的商品销量仅占所有销量的20%,这80%的商品在多个日期内都没有销量。若对所有商品的所有日期进行数据建模,补全所有商品没有销量的所有日期作为数据样本,会造成严重的数据稀疏,并且存储建模过后的数据样本会造成大量存储空间的浪费。同时数据建模过后的数据样本,由于存在大比例的销量为0的商品与日期的组合,使得数据分布不均匀,这种情况下算法模型无法很好的学习到数据样本中潜在的商品售卖特性,同时也会影响算法模型的学习效率。若不对所有商品进行建模,会舍弃大量商品特征,算法模型无法很好的学习到大部分商品的销售特性。
[0004]期刊文章 ...
【技术保护点】
【技术特征摘要】
1.基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,所述方法包括以下步骤:S1:数据收集,所述数据包括过去设定时间内真实的销售数据、商品数据和天气数据;S2:数据预处理,对S1所得销售数据、商品数据和天气数据进行数据清洗、数据筛选与数据类型统一转换;S3:数据建模,通过间断时间序列数据建模方法对步骤S2预处理后的数据进行数据建模,获得数据样本;所述间断时间序列数据建模方法通过补充天数增加数据样本量;S4:特征构建,对步骤S3所得数据样本进行销量特征构建;对S2所得预处理后的数据进行商品特征构建、零售商户特征构建、天气特征构建和日期特征构建;S5:数据集构建,将S3所得数据样本与S4所得所有特征进行组合,得到最终数据集;S6:模型训练,利用最终数据集进行模型训练,获得未来销量预测数据。2.根据权利要求1所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S2实现过程如下:S21:对S1所得的销售数据进行数据清洗,去除退货数据,得到零售商户设定时间内所有商品的销量数据,对销量数据进行数据筛选,筛选出零售商户编码
‑
在售商品编码
‑
销售日期
‑
商品销量4者组合数据;然后对该组合数据进行数据类型统一转换,将零售商户编码、在售商品编码与商品销量转换为整数类型数据,将销售日期转换为字符串类型数据;S22:对S1所得零售商户的设定时间内售卖所有商品数据进行数据清洗,去除已停售商品得到目前在售商品数据;之后对在售商品数据进行数据筛选,筛选出商品编码
‑
商品类目编码组合数据;之后对该组合数据进行数据类型统一转换,将商品编码与商品类目转换为整数类型数据;S23:对S1所得零售商户设定时间内历史天气数据进行数据筛选,筛选出零售商户编码
‑
日期
‑
天气
‑
最高温度
‑
最低温度组合数据;之后对组合数据进行数据类型统一转换,将零售商户编码与日期转换为字符串类型数据,将天气按照天气的中文代表字词的首字母进行排序,每个天气的排序值作为该天气的编码,将该编码转换为整数类型数据;将最高温度与最低温度转换为整数类型数据;S24:对S1所得零售商户过去2年内常规促销活动数据筛选,筛选出零售商户编码
‑
日期
‑
常规促销活动编码
‑
促销活动优惠力度组合数据;对组合数据进行数据类型统一转换,将零售商户编码与常规促销活动编码转换为字符串类型数据,将促销活动优惠力度转换为浮点数类型数据。3.根据权利要求2所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S3中所述的间断时间序列数据建模方法实现过程如下:S31:将S21所得零售商户编码
‑
在售商品编码
‑
销售日期
‑
商品销量4者组合数据按日期递增顺序进行排序,其中不包含商品销量为0的日期,由此形成间断时间序列;S32:对S31所得间断时间序列中每个商品出现销量的日期之后的n天内,补充该商品没有销量的日期的商品销量值为0,作为新的数据样本,数据样本为零售商户编码
‑
在售商品编码
‑
销售日期
‑
商品销量组合数据;使得建模后数据样本量和数据稀疏度满足要求;其中,n的取值范围为[1,+∞);S33:将S32所得数据样本与S21所得零售商户编码
‑
在售商品编码
‑
销售日期
‑
商品销量
组合数据按日期递增顺序进行排序,作为全部商品的所有数据样本。4.根据权利要求3所述的一种基于间断时间序列样本构建的销量预测模型的构建方法,其特征在于,步骤S32中,数值n的最优取值策略如下:首先,建模后数据样本量计算方式如公式(1)所示;其中,与代表数据建模后的数据样本总数;代表时间序列总数;代表第i个时间序列真实商品销量的数据样本量;代表数据建模想要填充销量值为0的日期总数;代表第i个序列每个有销量日期...
【专利技术属性】
技术研发人员:郭文宾,周瑞,李舒宁,曾云,张金银,
申请(专利权)人:杭州比智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。