一种基于机器学习及提前分类的新零售终端销售预测方法及系统技术方案

技术编号:32825786 阅读:20 留言:0更新日期:2022-03-26 20:28
本发明专利技术提供一种基于机器学习及提前分类的新零售终端销售预测方法,属于零售终端分析技术领域,本发明专利技术采取了如下技术方案:1.建立完善的预警体系。2.获取有效零售户基本信息与销售数据。3.对零售户销售数据进行清洗并确定多维度特征。4.基于选定特征对零售户群体合理分组。5.利用机器学习算法基于确定特征对零售户进行销售预测。以此提高预测结果的准确性。以此提高预测结果的准确性。

【技术实现步骤摘要】
一种基于机器学习及提前分类的新零售终端销售预测方法及系统


[0001]本专利技术涉及零售终端分析
,尤其涉及一种基于机器学习及提前分类 的新零售终端销售预测方法及系统。

技术介绍

[0002]随着信息技术及互联网技术的发展,为满足人们日益增长的消费需求,新零 售终端不断发展,在全国各地均得到广泛使用,其客户数和消费群体数量也越来 越多,利用好所产生数据的价值就能得到对市场环境的清晰洞察,从而便于企业 进行货品精准投放、指导现代终端客户合理布局等策略,也能帮助零售户合理配 置存货、调整商品结构,增强盈利能力。但如何基于海量销售数据进行市场销售 情况的预测是一个非常重要的课题。
[0003]目前对于零售终端样本的销售预测方法中,大多直接从海量销售数据中进行 数据预处理,特征提取,而后使用预测算法进行销售预测。对于销售而言,时间 也是非常重要的一个影响因素,不考虑时间这一特征参数将较大程度影响预测结 果;另一方面,销售情况也会因为各地域以及各层级零售户的不同而产生较大差 异。

技术实现思路

[0004]为了克服现有零售终端销售预测方法中存在的特征考虑不全面、预测结果不 准确等不足,本专利技术提供了一种基于机器学习及提前分类的新零售终端销售预测 方法,在考虑了时间这一特征对销售情况的影响下,结合既有特征和自定义特征 进行组合特征选取,提高特征的代表性和鲁棒性,然后基于无监督学习算法对零 售户进行分类,最后基于每个类别所训练模型进行销售预测,提高预测结果的准 确性。
[0005]本专利技术的技术方案是:
[0006]一种基于机器学习及提前分类的新零售终端销售预测方法。采取了如下技术 方案:1.建立完善的预警体系。2.获取有效零售户基本信息与销售数据。3.对零 售户销售数据进行清洗并确定多维度特征。4.基于选定特征对零售户群体合理分 组。5.利用机器学习算法基于确定特征对零售户进行销售预测。
[0007]包含以下内容:
[0008]数据采集阶段:采集使用零售终端的零售户基本属性信息及销售数据;
[0009]数据清洗阶段:基于指标阈值对零售户销售数据进行清洗,去除异常销售数 据;
[0010]特征选取阶段:对所采集的零售户基本属性信息及销售数据选取既有特征或 自定义特征;
[0011]零售户分组阶段:对零售户基于选定特征进行合理分组;
[0012]销售预测阶段:对零售户基于机器学习算法和选定特征进行销售行为预测;
[0013]数据规范阶段:对零售户设立预警项提前规范销售行为。
[0014]进一步的,数据采集阶段中,零售终端为可支持线上销售的设备,包括但不 限于
电脑、手机;可基于分析需要,选取零售户的基本属性信息及销售数据,如 地域、销量、各品类销量等。
[0015]进一步的,数据清洗阶段中,应对零售户销售数据进行清洗,对各项销售指 标设定阈值,将销售数据异常或造假的销售数据进行过滤。
[0016]进一步的,特征选取阶段中,可基于后续零售户分组以及销售预测的需求不 同选用两组针对性不同的特征,其中,特征的选取可选用零售户的基本属性信息 以及销售信息,如店铺规模、档位、销量、结余库存、销售笔数等。同时为得到 更能便于分析零售户的特征,可以对既有特征进一步加工,如可计算存销比、扫 码集中度、时间拟合度等,扫码集中度可定义为一天内每小时时段销售笔数中, 最大销售笔数的两个时段内的笔数和除以全天扫码笔数。对以上特征进行组合并 选优,确定样本特征,分别用于零售户分组以及销售预测,在使用特征时,需对 特征进行归一化操作,避免分类及拟合过程中奇异值的影响,并加速收敛过程。
[0017]特征选取阶段中,存在某些月份因包含重大节日,其销售情况会变化较大, 当用于销售预测时,可将时间因素考虑为特征之一,可通过对时间刻度设定权重 或使用考虑时间的机器学习方法实现。
[0018]进一步的,零售户分组阶段中,对选定用于零售户分组的特征基于无监督学 习算法进行分类操作,最优分类数可基于算法进行确定,但不宜过大,分类算法 可以采取K

Means算法、神经网络算法等。
[0019]进一步的,销售预测阶段中,确定机器学习预测算法对每零售户分组训练相 应模型,后基于每类模型对属于相应分组内的零售户进行销售预测。
[0020]进一步的,数据规范阶段中,通过规划一整套销售预警体系提前规范销售行 为,预警项可设立规则如:日扫码集中度预警、卷烟单笔单规格预警、卷烟销售 种类占比预警等。预警可通过上级监督进行状态变更处理。
[0021]本专利技术还提供了一种基于机器学习及提前分类的新零售终端销售预测系统, 其特征在于,
[0022]数据采集机构:采集使用零售终端的零售户基本属性信息及销售数据;
[0023]数据清洗机构:基于指标阈值对零售户销售数据进行清洗,去除异常销售数 据;
[0024]特征选取机构:对所采集的零售户基本属性信息及销售数据选取既有特征或 自定义特征;
[0025]零售户分组机构:对零售户基于选定特征进行分组;
[0026]销售预测机构:对零售户基于机器学习算法和选定特征进行销售行为预测;
[0027]数据规范机构:对零售户设立预警项提前规范销售行为。
[0028]进一步的,
[0029]进一步的,数据采集机构中,零售终端为可支持线上销售的设备,包括但不限 于电脑、手机;可基于分析需要,选取零售户的基本属性信息及销售数据,如地 域、销量、各品类销量等。
[0030]进一步的,数据清洗机构中,应对零售户销售数据进行清洗,对各项销售指 标设定阈值,将销售数据异常或造假的销售数据进行过滤。
[0031]进一步的,特征选取机构中,可基于后续零售户分组以及销售预测的需求不 同选
用两组针对性不同的特征,其中,特征的选取可选用零售户的基本属性信息 以及销售信息,如店铺规模、档位、销量、结余库存、销售笔数等。同时为得到 更能便于分析零售户的特征,可以对既有特征进一步加工,如可计算存销比、扫 码集中度、时间拟合度等,扫码集中度可定义为一天内每小时时段销售笔数中, 最大销售笔数的两个时段内的笔数和除以全天扫码笔数。对以上特征进行组合并 选优,确定样本特征,分别用于零售户分组以及销售预测,在使用特征时,需对 特征进行归一化操作,避免分类及拟合过程中奇异值的影响,并加速收敛过程。
[0032]特征选取机构中,存在某些月份因包含重大节日,其销售情况会变化较大, 当用于销售预测时,可将时间因素考虑为特征之一,可通过对时间刻度设定权重 或使用考虑时间的机器学习方法实现。
[0033]进一步的,零售户分组机构中,对选定用于零售户分组的特征基于无监督学 习算法进行分类操作,最优分类数可基于算法进行确定,但不宜过大,分类算法 可以采取K

Means算法、神经网络算法等。
[0034]进一步的,销售预测机构中,确定机器学本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习及提前分类的新零售终端销售预测方法,其特征在于,包含以下内容:数据采集阶段:采集使用零售终端的零售户基本属性信息及销售数据;数据清洗阶段:基于指标阈值对零售户销售数据进行清洗,去除异常销售数据;特征选取阶段:对所采集的零售户基本属性信息及销售数据选取既有特征或自定义特征;零售户分组阶段:对零售户基于选定特征进行分组;销售预测阶段:对零售户基于机器学习算法和选定特征进行销售行为预测;数据规范阶段:对零售户设立预警项提前规范销售行为。2.根据权利要求1所述的方法,其特征在于,数据采集阶段中,零售终端为可支持线上销售的设备,包括电脑、手机;可基于分析需要,选取零售户的基本属性信息及销售数据。3.根据权利要求1所述的方法,其特征在于,数据清洗阶段中,应对零售户销售数据进行清洗,对各项销售指标设定阈值,将销售数据异常或造假的销售数据进行过滤。4.根据权利要求1所述的方法,其特征在于,特征选取阶段中,可基于后续零售户分组以及销售预测的需求不同选用两组针对性不同的特征,其中,特征的选取可选用零售户的基本属性信息以及销售信息;同时为得到更能便于分析零售户的特征,可以对既有特征进一步加工;扫码集中度可定义为一天内每小时时段销售笔数中,最大销售笔数的两个时段内的笔数和除以全天扫码笔数;对以上特征进行组合并选优,确定样本特征,分别用于零售户分组以及销售预测,在使用特征时,需对特征进行归一化操作,避免...

【专利技术属性】
技术研发人员:林大伟肖建国周凯
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1