System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于DBSCAN和用户群体特性分析的产品销量预测方法技术_技高网

基于DBSCAN和用户群体特性分析的产品销量预测方法技术

技术编号:41133104 阅读:3 留言:0更新日期:2024-04-30 18:03
本发明专利技术涉及基于DBSCAN和用户群体特性分析的产品销量预测方法,包括:采集订单样本数据;对订单样本数据进行预处理;采用基于密度的聚类算法对订单样本数据进行聚类分析;划分用户群体,并进行用户群体特性分析;采用差分自回归移动平均模型ARIMA预测用户群体在未来时间段的采购可能性;根据用户群体特性分析结果,计算用户群体的相似度,对具有相似度的用户群体进行产品推荐;对未来时间段的产品销量进行预测。本发明专利技术通过ARIMA模型预测用户群体在未来时间段的采购可能性,并计算用户群体的相似度,根据ARIMA模型的计算结果和用户群体相似度,计算得到未来时间段的产品销量的预测值,提高了产品销量预测的科学性和准确性,便于电商平台和产品生产方提前备货。

【技术实现步骤摘要】

本专利技术属于计算机信息处理领域,具体涉及一种基于dbscan和用户群体特性分析的产品销量预测方法。


技术介绍

1、随着电子商务的蓬勃发展,各大电商平台上的商品数量激增,给产品销量预测带来了巨大挑战。精准预测产品销量,对电商运营具有重要意义,能指导电商平台及时备货,提高资源利用效率,避免库存积压或缺货。但是,现有的产品销量预测方法存在以下问题:

2、1)现有方法多依赖于产品本身的历史销量数据进行预测,未充分考虑用户行为的数据。不同用户及用户群体对产品的兴趣和购买力存在差异,这会直接影响产品的销量。现有方法缺乏对用户特性的挖掘与建模,导致预测结果偏差较大。

3、2)现有方法对产品销量进行整体预测,未区分不同用户群体。将所有用户混合在一起进行建模,无法反映不同用户群体的行为特征。这也降低了预测的针对性和准确率。

4、3)现有方法缺乏考虑用户之间的相互影响。具有相似兴趣或特征的用户群体之间会互相影响,从而影响产品的销量预测。现有的产品销量预测方法未能建模并应用这种用户群体之间的相互影响关系。

5、4)针对电商海量的复杂订单数据,现有方法直接利用原始数据建模未对原始订单数据预处理,易受异常数据或噪声数据的影响。

6、针对上述问题,本专利技术研究一种基于密度的聚类算法(density-based spatialclustering of applications with noise,dbscan)和用户群体行为特征建模的产品销量预测方法,以解决现有技术中的不足,提高预测的准确性


技术实现思路

1、本专利技术的技术问题是现有的电商产品的销量预测方法缺乏考虑用户/用户群体之间的相互影响作用,因而无法准确地预测在未来时间段的产品销量。

2、本专利技术的目的是针对上述问题,提供一种基于dbscan和用户群体特性分析的产品销量预测方法,对订单样本数据进行聚类分析,在聚类分析结果的基础上划分用户群体,并进行用户群体特性分析,进一步计算用户群体的相似度;采用差分自回归移动平均模型(autoregressive integrated moving average model,arima)预测用户群体在未来时间段的采购可能性;根据arima模型的计算结果和用户群体相似度,计算得到未来时间段的产品销量的预测值,提高产品销量预测的科学性和准确性,便于电商平台和产品生产方提前备货。

3、本专利技术的技术方案是基于dbscan和用户群体特性分析的产品销量预测方法,包括以下步骤:

4、步骤1:收集电子商城的用户历史订单数据信息,形成订单样本数据;

5、步骤2:对订单样本数据进行预处理,所述预处理包括数据清洗和格式化;

6、步骤3:采用基于密度的聚类算法对订单样本数据进行聚类分析;

7、步骤4:根据步骤3的聚类分析结果,划分用户群体,并进行用户群体特性分析;

8、步骤5:采用差分自回归移动平均模型arima预测用户群体在未来时间段的采购可能性;

9、步骤6:根据步骤4的用户群体特性分析结果,计算用户群体的相似度,并结合步骤5的结果,对具有相似度的用户群体进行产品推荐;

10、步骤7:根据步骤5、6的计算结果,对未来时间段的产品销量进行预测。

11、优选地,步骤2具体包括:

12、1)对订单样本数据集中缺失关键字段如userid,productid等的订单进行识别,并将这些订单记录从订单样本数据集中移除;

13、2)检查订单样本数据集中是否有完全相同或部分相同的订单记录,去除重复的订单记录;

14、3)检查与处理订单中的购买数量为小于等于零或者产品号productid不存在的无效或异常订单。

15、进一步地,步骤2还包括对以下异常情况的订单记录进行识别、判断和去除:

16、a)异常高或低购买数量的订单记录,订单中的某个产品的购买数量远高于该用户或类似用户平均购买数量;

17、b)短时间内出现的大量相同订单记录;

18、c)短时间内出现前、后购买地理位置不一致的订单记录;

19、d)未知或非法产品号productid的订单记录。

20、进一步地,步骤3中,所述基于密度的聚类算法,具体包括:

21、1)将样本数据表示成空间中的点;

22、2)随机选择一个未被访问的样本点;

23、3)计算该点的邻域;

24、4)统计该点的邻域中的样本点数量,并比较样本点的数量与最小包含点数minpts的大小,若邻域中样本点数量大于等于最小包含点数minpts,则创建新的簇,否则将该点标记为噪声;

25、5)重复执行步骤2)-步骤4),直至所有样本点都被访问。

26、优选地,步骤4中,所述用户群体特性分析,包括分析用户群体对产品的平均购买频率、购买的产品种类、对产品的购买时间分布。

27、进一步地,步骤5具体包括以下子步骤:

28、步骤5.1:根据商城产品的销售记录,对各产品的用户群体构建用于预测该用户未来时间段采购可能性的arima模型;

29、步骤5.2:对步骤5.1的arima模型,提取相关因素,检验相关因素的相关性,提取相关性高的相关因素作为多元线性回归的自变量;

30、步骤5.3:提取自回归自变量,建立自回归序列,对序列进行差分,并根据自相关和偏相关参数进一步对arima模型定阶;

31、步骤5.4:对步骤5.3得到的arima模型进行拟合、验证及调整,对各参数显著性进行检验,得到完备的产品的arima模型;

32、步骤5.5:利用步骤5.4的产品的arima模型,根据产品的历史销量数据,预测用户群体未来时段采购该产品的可能性;

33、步骤5.6:重复步骤5.1-5.5,对商城的每件产品构建arima模型,并利用arima模型计算得到该产品的用户群体在未来时段的采购可能性得分。

34、进一步地,步骤6具体包括以下子步骤:

35、步骤6.1:分别整理用户群体中用户的历史订单数据;

36、步骤6.2:构建用户-产品矩阵;

37、步骤6.3:根据用户-产品矩阵和用户群体特性分析结果,计算用户群体之间的用户相似度;

38、步骤6.4:根据步骤6.3计算得到的用户群体之间的用户相似度的大小,若某用户群体发生产品购买行为,对具有相似度的其他用户群体的用户推送产品推荐建议。

39、优选地,步骤7中,用户群体在未来时段的产品预测销量为:

40、predicted_sales=arima_forecast×p

41、式中arima_forecast表示arima模型计算得到的用户群体在未来时段的采购可能性得分,p表示用户群体的用户在历史同期购买该产品的平均数量,pre本文档来自技高网...

【技术保护点】

1.基于DBSCAN和用户群体特性分析的产品销量预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的产品销量预测方法,其特征在于,步骤2具体包括:

3.根据权利要求2所述的产品销量预测方法,其特征在于,步骤2还包括对以下异常情况的订单记录进行识别、判断和去除:

4.根据权利要求1或2或3所述的产品销量预测方法,其特征在于,步骤3中,所述基于密度的聚类算法,具体包括:

5.根据权利要求4所述的产品销量预测方法,其特征在于,步骤4中,所述用户群体特性分析,包括分析用户群体对产品的平均购买频率、购买的产品种类、对产品的购买时间分布。

6.根据权利要求5所述的产品销量预测方法,其特征在于,步骤5具体包括以下子步骤:

7.根据权利要求6所述的产品销量预测方法,其特征在于,步骤6具体包括以下子步骤:

8.根据权利要求7所述的产品销量预测方法,其特征在于,步骤7中,用户群体在未来时段的产品预测销量为:

【技术特征摘要】

1.基于dbscan和用户群体特性分析的产品销量预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的产品销量预测方法,其特征在于,步骤2具体包括:

3.根据权利要求2所述的产品销量预测方法,其特征在于,步骤2还包括对以下异常情况的订单记录进行识别、判断和去除:

4.根据权利要求1或2或3所述的产品销量预测方法,其特征在于,步骤3中,所述基于密度的聚类算法,具体包括:

5.根据权利要求4...

【专利技术属性】
技术研发人员:何建吾张撼难朱少磊刘宏杰
申请(专利权)人:长江三峡成都电子商务有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1