销量数据预测方法、装置以及相关设备制造方法及图纸

技术编号:23854546 阅读:40 留言:0更新日期:2020-04-18 10:23
本发明专利技术实施例公开了销量数据预测方法、装置以及相关设备,该方法包括:电子设备获取样本数据;样本数据包括门店销量数据和与门店对应的特征数据;对特征数据和门店销量数据进行特征提取得到特征样本;将门店销量数据作为第一训练样本的因变量,与特征样本作为第一训练样本的自变量构成第一训练样本;基于第一训练样本对聚类模型进行训练得到N个聚类簇样本;基于N个聚类簇样本对回归模型进行训练得到N个回归模型;训练后的聚类模型和回归模型用于对待预测门店进行销售数据预测。采用本发明专利技术实施例,可以确定预测门店的聚类类别,选择与该聚类类别对应的回归模型来进行预测,解决了因对模型训练不够而预测不准确的问题,提高了业务预测的准确性。

Sales volume data prediction methods, devices and related equipment

【技术实现步骤摘要】
销量数据预测方法、装置以及相关设备
本申请涉及数据处理
,尤其涉及一直销量数据预测方法、装置以及相关设备。
技术介绍
对于门店的智慧零售来说,需要对未来一段时间的销量进行预测,这样有助于门店准确的制定业务目标,从而把握门店对未来销量的计划。现有技术中公开的销量数据预测方法,一般是通过将每个门店每个月的销量作为一个样本,设计门店相关特征,天气和日期相关特征,基于移动位置服务相关特征,然后对样本按照比例随机抽取训练样本和评估样本。对训练样本使用回归模型进行训练,使用评估样本对训练好的模型进行评估,当模型的RMSE等指标达到一定标准后,模型训练完成,对于某个门店未来某个月的销量,按照同样方式抽取特征,使用训练好的模型预测其销量。然而当已有门店的历史销量分布很不均衡的时候,比如销量很高或者很低的样本,在模型训练的时候,由于其样本数量较少,模型对于这部分的样本训练不够充分,导致在预测销量这部分的样本时,对于销量很低的样本,模型预测的销量会偏高较多,对于销量较高的样本,模型预测会偏低较多,会导致预测准确率低。专本文档来自技高网...

【技术保护点】
1.一种销量数据预测方法,其特征在于,包括:/n电子设备获取样本数据;所述样本数据包括门店销量数据和与门店对应的特征数据;所述特征数据包括基于移动位置服务特征数据、兴趣点特征数据、天气特征数据、日期特征数据中的至少一项;/n所述电子设备对所述与门店对应的特征数据和所述门店销量数据进行特征提取得到与门店对应的特征样本;/n所述电子设备将所述门店销量数据作为第一训练样本的因变量,所述与门店对应的特征样本作为所述第一训练样本的自变量构成所述第一训练样本;/n所述电子设备基于所述第一训练样本对聚类模型进行训练,得到N个聚类簇样本;/n所述电子设备基于所述N个聚类簇样本对回归模型进行训练,得到与所述N个...

【技术特征摘要】
1.一种销量数据预测方法,其特征在于,包括:
电子设备获取样本数据;所述样本数据包括门店销量数据和与门店对应的特征数据;所述特征数据包括基于移动位置服务特征数据、兴趣点特征数据、天气特征数据、日期特征数据中的至少一项;
所述电子设备对所述与门店对应的特征数据和所述门店销量数据进行特征提取得到与门店对应的特征样本;
所述电子设备将所述门店销量数据作为第一训练样本的因变量,所述与门店对应的特征样本作为所述第一训练样本的自变量构成所述第一训练样本;
所述电子设备基于所述第一训练样本对聚类模型进行训练,得到N个聚类簇样本;
所述电子设备基于所述N个聚类簇样本对回归模型进行训练,得到与所述N个聚类簇样本对应的N个回归模型;
其中,训练后的所述聚类模型和所述回归模型用于对待预测门店的销售数据进行预测。


2.根据权利要求1所述的方法,其特征在于,所述电子设备获取样本数据包括:
所述电子设备接收样本数据的待预测数据;
所述电子设备对所述样本数据的待预测数据进行预处理,得到所述样本数据。


3.根据权利要求1所述的方法,所述电子设备基于所述第一训练样本对聚类模型进行训练,得到N个聚类簇样本包括:
所述电子设备将所述第一训练样本输入到待训练的聚类模型中,采用K-means算法对所述聚类模型进行训练;
所述电子设备调整所述聚类模型的参数,当所述聚类模型的评价指标达到预设阈值后,得到N个聚类簇样本。


4.根据权利要求1所述的方法,其特征在于,所述电子设备基于所述N个聚类簇样本对回归模型进行训练,得到与所述N个聚类簇样本对应的N个回归模型包括:
所述电子设备针对N个聚类簇样本,从中随机抽取第二训练样本和评估样本;
所述电子设备分别将所述第二训练样本输入到回归模型中采用XGBoost算法对所述回归模型进行训练,得到训练后的回归模型;
所述电子设备分别将所述评估样本输入到所述训练后的回归模型中;当所述训练后的回归模型的评价指标达到某预设阈值后,得到与N个聚类簇样本对应的N个回归模型。


5.一种销量数据预测方法,其特征在于,包括:
电子设备获取待预测门店对应的特征数据;所述特征数据包括基于移动位置服务数据、兴趣点数据、天气数据、日期数据中的至少一项;
所述电子设备对所述特征数据进行特征提取得到待预测门店的特征样本;
所述电子设备将所述待预测门店的特征样本输入训练完成的聚类模型中,通过所述训练完成的聚类模型确认所述待预测门店的特征样本的聚类;所述聚类模型包括如权利要求1-4任一项所述的方法中训练后的聚类模型;
所述电子设备根据所述待预测门店的特征样本的聚类,确认对应的训练完成的回归模型;所述回归模型包括如权利要求1-4任一项所述的方法中训练后的回归模型;
所述电子设备将所述待预测门店的特征样本输入到所述对应的训练完成的回归模型中,得到所述待预测门店的...

【专利技术属性】
技术研发人员:顾立瑞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1