当前位置: 首页 > 专利查询>湖州学院专利>正文

一种基于决策树和BP神经网络的商品畅滞销分析方法技术

技术编号:38549470 阅读:11 留言:0更新日期:2023-08-22 20:57
本发明专利技术公开了一种基于决策树和BP神经网络的商品畅滞销分析方法,通过获取商品销售数据快速预测出商品的畅滞销状态及未来走势并对在售商品的重要特征进行筛选实时计算各个特征的贡献率,可以有效地提高商家的决策效率,降低库存风险,适用于各类商品的畅滞销状态分析。态分析。态分析。

【技术实现步骤摘要】
一种基于决策树和BP神经网络的商品畅滞销分析方法


[0001]本专利技术涉及一种基于决策树和BP神经网络的商品畅滞销分析方法,属于电子信息

技术背景
[0002]在当前市场经济下,商品的畅销与否对于商家的盈利能力有着至关重要的影响。然而,商品的畅销状态受到众多因素的影响,如价格、促销活动、销售渠道等。传统的基于统计模型的畅销状态分析方法在准确性和实时性方面均存在着一定的局限性。因此,需要一种更为高效、准确的商品畅滞销状态分析方法,以帮助商家快速准确地预测商品的销售状况及未来走势。本专利技术提出了一种基于决策树和BP神经网络的商品畅滞销分析方法,通过获取商品销售数据快速预测出商品的畅滞销状态及未来走势并对在售商品的重要特征进行筛选实时计算各个特征的贡献率,可以有效地提高商家的决策效率,降低库存风险,适用于各类商品的畅滞销状态分析。

技术实现思路

[0003]专利技术目的:为了克服商品决策人员由于主观经验导致错估商品价值,无法准确预测商品未来销售走势,本专利技术提供了一种基于决策树和BP神经网络的商品畅滞销分析方法,该方案能够实现对商品重要特征的筛选以及精准预测商品的畅滞销状态,从而更好的为商品决策人员提供科学的辅助决策功能。
[0004]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0005]一种基于决策树与BP神经网络的商品畅滞销分析方法,包括以下步骤:
[0006]步骤1,商品集合;商品集合就是指商品买卖所产生的交易信息。其中所述的交易信息包括商品本身数据:商品名称、商品零售价、商品毛利、上市日期、供应商、铺货门店;以及交易数据:商品累计销售量、商品月零售数量、商品动销率、商品库存周转率、商品累计销售金额、商品库存量。
[0007]步骤2,数据采集;将所有的数据源导入数据库统一成结构化数据表,其中所述结构化数据表是一种二维数据表具体信息包括商品名称、商品零售价、商品销售额、商品月零售数量、商品动销率、商品铺货门店数量、商品库存库存周转率。
[0008]步骤3,特征工程;首先将采集到的商品信息按照预设类型划分成两个特征矩阵,其中一个为字符串类型的特征矩阵T
str
,另一个为数值类型的特征矩阵T
num

[0009]商品信息可由如下的一维矩阵表示:
[0010]S=(V
1 V
2 V3...V
n

1 V
target
)
[0011]其中S表示商品信息集合,V
i
表示字段名称,V
target
表示预测标签,其中所述的预测标签就是商品实际的畅滞销状态。
[0012]T
str
特征矩阵可由如下的二维矩阵表示:
[0013][0014]其中T
str
表示字符串类型的特征矩阵集合,V
i
表示字段名称,C
i
表示非缺失值数量,U
i
表示唯一值个数,M
i
表示缺失值占比,M
i
=C
i
/总行数。
[0015]T
num
特征矩阵可由如下的二维矩阵表示:
[0016][0017]其中T
num
表示数值类型的特征矩阵集合,V
i
表示字段名称,C
i
表示非缺失值数量,M
i
表示缺失值占比,Max
i
表示最大值,Min
i
表示最小值,Mean
i
表示均值,Median
i
表示中位数,Corr
i
表示与V
target
的相关系数,其中相关系数表示与V
target
的关联强度,取值范围在[

1,1],大于零表示正相关,小于零表示负相关。
[0018]其次针对T
str
特征矩阵根据M
i
决定是否保留。若M
i
>30%则将对应的V
i
字段删除;若M<30%则通过决策树进行预测填充,最后采用二进制编码手段将T
str
进行编码。针对T
num
矩阵,首先根据Corr
i
决定是否保留V
i
,若Corr
i
>50%则保留,否则进行删除;其次根据M
i
对V
i
进行二次筛选,若M
i
>30%则将对应的V
i
字段删除;若M<30%则根据V
i
的分布特性进行填充,如果V
i
是正态分布则采用Mean
i
对缺失值进行填充,非正态分布则采用Median
i
进行填充;结合Max
i
,Min
i
对异常值进行检测,去除噪声点;最后通过变量转化使数据分布接近于正态分布。
[0019]步骤4,模型训练与优化;首先模型训练采用决策树算法计算V
i
~V
n
‑1对V
target
的贡献率,若贡献率>=25%则进行保留;若贡献率<25%则进行剔除。其次将保留的V
i
数据通过BP神经网络进行拟合,预测结果根据打分公式进行评分:
[0020]打分公式如下:
[0021][0022][0023]P
pos
表示一组随机样本(一个正样本,一个负样本)中预测结果为正样本的概率;P
neg
表示一组随机样本(一个正样本,一个负样本)中预测结果为负样本的概率;若P
pos
>P
neg
输出I=1,P
pos
=P
neg
输出I=0.5,P
pos
<P
neg
输出I=0;M表示正样本的个数,N表示负样本的个数,Score1的取值范围在(0,1)越接近1分类的准确度越高。
[0024]若Score1>0.8则执行步骤5,否则调整BP神经网络的神经元数目、隐层数以及最大迭代次数重新执行步骤4。
[0025]步骤5:决策树、BP神经网络预测;基于训练好的模型对测试数据进行预测生成预测集,其中所述的预测集最核心的内容是商品的预测结果。
[0026]步骤6:预测集准确率预估;基于上述决策树、BP神经网络的预测结果对生成的结果集打分:
[0027]打分公式:
[0028][0029]若Score2>0.8则生成结果集,其中结果集内容包括商品名称、商品各特征贡献率、商品本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于决策树与BP神经网络的商品畅滞销分析方法,其特征在于,包括以下步骤:步骤1,商品集合;商品集合就是指商品买卖所产生的交易信息。其中所述的交易信息包括商品本身数据:商品名称、商品零售价、商品毛利、上市日期、供应商、铺货门店;以及交易数据:商品累计销售量、商品月零售数量、商品动销率、商品库存周转率、商品累计销售金额、商品库存量。步骤2,数据采集;将所有的数据源导入数据库统一成结构化数据表,其中所述结构化数据表是一种二维数据表具体信息包括商品名称、商品零售价、商品销售额、商品月零售数量、商品动销率、商品铺货门店数量、商品库存库存周转率。步骤3,特征工程;首先将采集到的商品信息按照预设类型划分成两个特征矩阵,其中一个为字符串类型的特征矩阵T
str
,另一个为数值类型的特征矩阵T
num
。商品信息可由如下的一维矩阵表示:S=(V
1 V
2 V3...V
n

1 V
target
)其中S表示商品信息集合,V
i
表示字段名称,V
target
表示预测标签,其中所述的预测标签就是商品实际的畅滞销状态。T
str
特征矩阵可由如下的二维矩阵表示:其中T
str
表示字符串类型的特征矩阵集合,V
i
表示字段名称,C
i
表示非缺失值数量,U
i
表示唯一值个数,M
i
表示缺失值占比,M
i
=C
i
/总行数。T
num
特征矩阵可由如下的二维矩阵表示:其中T
num
表示数值类型的特征矩阵集合,V
i
表示字段名称,C
i
表示非缺失值数量,M
i
表示缺失值占比,Max
i
表示最大值,Min
i
表示最小值,Mean
i
表示均值,Median
i
表示中位数,Corr
i
表示与V
target
的相关系数,其中相关系数表示与V
target
的关联强度,取值范围在[

1,1],大于零表示正相关,小于零表示负相关。其次针对T
str
特征矩阵根据M
i
决定是否保留。若M
i
>30%则将对应的V
i
字段删除;若M<30%则通过决策树进行预测填充,最后采用二进制编码手段将T
str
进行编码。针对T
num
矩阵,首先根据Corr
i
决定是否保留V
i
,若Corr
i
>50%则保留,否则进行删除;其次根据M
i
对V
i
进行二次筛选,若M
i
>30%则将对应的V
i
字段删除;若M<30%则根据V
i
的分布特性进行填充,如果V
i
是正态分布则采用Mean
i
对缺失值进行填充,非正态分布则采用Median
i
进行填充;结合
Max
i
...

【专利技术属性】
技术研发人员:孙文学金晓晓唐陈宇陈成
申请(专利权)人:湖州学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1