一种基于大数据的销售信息预测方法及装置制造方法及图纸

技术编号:38505428 阅读:12 留言:0更新日期:2023-08-19 16:52
本发明专利技术公开了一种基于大数据的销售信息预测方法及装置,通过获取待处理产品的历史数据,将历史数据进行清洗和标准化的特征处理以形成输入模型进行训练的数据集,根据业务需求信息、历史销售数据选定预测产品和产品的预测销量以设定预测参数,根据数据集、预测参数构建产品对应的预测模型,对预测模型进行预测效果评价,根据预测效果评价采用注意力机制和趋势调整的循环神经网络模型对带有特征的销售预测进行建模以建立多元线性回归预测模型已完成销售预测,根据多元线性回归算法建立的模型的预测能力,因变量与影响因素之间存在显著性关系已完成销售预测,可以得到更加客观正确的结果,大大提高了预测结果的准曲率,提高业务预测市场的效率。务预测市场的效率。务预测市场的效率。

【技术实现步骤摘要】
一种基于大数据的销售信息预测方法及装置


[0001]本专利技术属于数据处理
,尤其涉及一种基于大数据的销售信息预测方法及装置。

技术介绍

[0002]随着互联网时代的兴起,很多大型企业内部管理都已经项CRM系统过渡,在大型商场的售货、商品的定价、商品的销量和库存等信息都是由老板或员工手写记录的。近年来商品条形码技术火速发展并应有到实际生活中,分布式数据库技术的发展也为大型连锁超市的管理系统提供了技术基础。目前,人工智能技术的兴起,市场竞争压力越来越大,公司在运营过程中会产生大量的数据,对这些数据进行合理的利用,发现数据内部的深层联系,通过对未来进行预测都会增大企业的核心竞争力。然而,伴随着各种CRM系统的兴起,越来越多的销售数据浮现出来,企业CRM系统的数据库中记录的各种影响销量预测的行为得到了可能,但多维度的特征使得销售预测从自回归问题演变成了带有特征的销售时间序列预测问题,从而影响了销售预测的有效性和精确度。

技术实现思路

[0003]有鉴于此,本专利技术提供了一种可以提升预测未来销量准确性、预测精度和及时性的基于大数据的销售信息预测方法及装置,来解决上述存在的技术问题,具体采用以下技术方案来实现。
[0004]第一方面,本专利技术提供了一种基于大数据的销售信息预测方法,包括以下步骤:
[0005]获取待处理产品的历史数据,将所述历史数据进行清洗和标准化的特征处理以形成输入模型进行训练的数据集,其中,所述历史数据包括业务需求信息和历史销售数据;
[0006]分别根据所述业务需求信息、历史销售数据选定预测产品和所述产品的预测销量以设定预测参数,其中,所述预测参数包括预测长度、训练起始时间和时间序列;
[0007]根据所述数据集、所述预测参数构建所述产品对应的预测模型,并对所述预测模型进行预测效果评价,根据所述预测效果评价采用注意力机制和趋势调整的循环神经网络模型对带有特征的销售预测进行建模以建立多元线性回归预测模型已完成销售预测,其中,通过对数据预处理找出与因变量相关度大的自变量,预设全部的特征集合为与其对应的销售额集合为在t时刻其中n表示特征的维度,T表示整个的时间阶段,销售预测的输出是T个时间阶段后的接下来的Δ个销售值,销售值表示为Δ表示根据销售预测的目标决定的,若Δ<<T且在预测阶段都是未知的因素。
[0008]作为上述技术方案的进一步改进,根据所述数据集、所述预测参数构建所述产品对应的预测模型,并对所述预测模型进行预测效果评价,包括:
[0009]预设N个对象即产品在T个时间节点上的数据记录的R
ij
的背景下,在维持对象的潜
因子矩阵服从高斯分布的前提下,预设时间的潜因子矩阵服从马尔科夫随机场,使用MAFTIS模型对含有缺失的时间序列数据实现潜因子矩阵拟合,MAFTIS模型预设的数据记录矩阵R服从均值为U
T
V,方差为的高斯分布的表达式为其中L
ij
表示指示函数,当L
ij
取值为1时表示对象即产品i在实际点j上有记录,反之则取值为0;
[0010]预设对象的潜因子矩阵服从期望为0,协方差矩阵为的高斯分布,对应的表达式为预设时间的潜因子矩阵服从均值为0,协方差矩阵为的高斯分布,对应的表达式为
[0011]预设V中所有列向量对给定先验与ζ构成马尔科夫随机场的表达式为其中其中为归一化因子。
[0012]作为上述技术方案的进一步改进,使用MAFTIS模型对含有缺失的时间序列数据实现潜因子矩阵拟合,包括:
[0013]MAFTIS模型下S作为U1,U2...U
N
和V1,V2...V
T
的目标函数,记S对U
i
的偏导为对V
j
的偏导为则交替梯度下降法的求解过程包括:对i=1,2...N并令对j=1,2...T并令其中η1、η2表示学习率,以实现对矩阵U和V的更新;
[0014]预设有n个用户在T个产品上有评分并形成一个n
×
T维的用户

产品评分矩阵Y,矩阵中的元素y
ij
表示用户i对产品j的评分,通过用户

产品评分矩阵中已知的评分来获取用户和产品的潜在特征矩阵,根据所得的潜在特征矩阵预测评分矩阵中的未知数;
[0015]将用户

产品评分就诊Y中已知评分拟合获得矩阵和矩阵和矩阵使得成立,其中矩阵L表示用户的潜在特征矩阵,描述着n个用户的属性,矩阵S表示项目的潜在特征矩阵,描述T0个项目的属性,若Y服从均值为μ,方差为σ2的高斯分布的表达式为式为其中R
ij
为指示函数,当其取值为1时表示用户i对产品进行了评分,反之则取值为0;
[0016]若L服从期望为0,则方差的高斯分布的表达式为的高斯分布的表达式为若S服从期望为0,则方差的高斯分布的表达式为采用后验概率公式得到三个矩阵的联合分布的表达式为并取对数使最大化对数后的后
验概率相当于最小化的表达式为验概率相当于最小化的表达式为其中而表示Frobenius范式,对高斯函数的均值施加logistic函数g(x)=1/(1+exp(

x)),其取值为0到1之间,最后的目标函数改写的表达式为1之间,最后的目标函数改写的表达式为使用梯度下降法通过求解L
i
、S
j
中的每个元素。
[0017]作为上述技术方案的进一步改进,分别根据所述业务需求信息、历史销售数据选定预测产品和所述产品的预测销量以设定预测参数,包括:
[0018]将预测参数设定为f,真实值记为y,序列第t期的真实值记为yt,第t期的预测值为Ft,则预测误差为et=yt

Ft,衡量预测精度的均方根误差RMSE的表达式为
[0019]作为上述技术方案的进一步改进,预设y'为销售趋势热度,x1,x2...x
n
为一定时间产品的出库数量,c1,c2...c
n
为其对应的加权平均值,则销售趋势热度的表达式为y'=c1x1+c2x2+...c
n
x
n

[0020]将因变量y0和p个回归变量x1,x2...x
n
分别建立一元回归方程的表达式为y0=β0x0+β
i
x
i
+ω,i=1...p,计算变量x
i
对应的回归系数的F检验统计量的值,记为取其中的最大值的表达式为的表达式为对给定的显著性水平ε,将相应的临界值记为F
(1)
,若则将引入回归模型,将选入变量指标集合标记为L1;
[0021]建立因变量y0与自变量的二元回归方程,共有p

1个,计算变量的回归系数F检验的统计量值,记为将最大值记为记相应的临界值为F
(2)
,若满足将变量引入回归模型,否则不引入回归模型,根据因变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的销售信息预测方法,其特征在于,包括以下步骤:获取待处理产品的历史数据,将所述历史数据进行清洗和标准化的特征处理以形成输入模型进行训练的数据集,其中,所述历史数据包括业务需求信息和历史销售数据;分别根据所述业务需求信息、历史销售数据选定预测产品和所述产品的预测销量以设定预测参数,其中,所述预测参数包括预测长度、训练起始时间和时间序列;根据所述数据集、所述预测参数构建所述产品对应的预测模型,并对所述预测模型进行预测效果评价,根据所述预测效果评价采用注意力机制和趋势调整的循环神经网络模型对带有特征的销售预测进行建模以建立多元线性回归预测模型已完成销售预测,其中,通过对数据预处理找出与因变量相关度大的自变量,预设全部的特征集合为与其对应的销售额集合为在t时刻其中n表示特征的维度,T表示整个的时间阶段,销售预测的输出是T个时间阶段后的接下来的Δ个销售值,销售值表示为Δ表示根据销售预测的目标决定的,若Δ<<T且在预测阶段都是未知的因素。2.根据权利要求1所述的基于大数据的销售信息预测方法,其特征在于,根据所述数据集、所述预测参数构建所述产品对应的预测模型,并对所述预测模型进行预测效果评价,包括:预设N个对象即产品在T个时间节点上的数据记录的R
ij
的背景下,在维持对象的潜因子矩阵服从高斯分布的前提下,预设时间的潜因子矩阵服从马尔科夫随机场,使用MAFTIS模型对含有缺失的时间序列数据实现潜因子矩阵拟合,MAFTIS模型预设的数据记录矩阵R服从均值为U
T
V,方差为的高斯分布的表达式为其中L
ij
表示指示函数,当L
ij
取值为1时表示对象即产品i在实际点j上有记录,反之则取值为0;预设对象的潜因子矩阵服从期望为0,协方差矩阵为的高斯分布,对应的表达式为预设时间的潜因子矩阵服从均值为0,协方差矩阵为的高斯分布,对应的表达式为预设V中所有列向量对给定先验与ζ构成马尔科夫随机场的表达式为其中其中为归一化因子。3.根据权利要求2所述的基于大数据的销售信息预测方法,其特征在于,使用MAFTIS模型对含有缺失的时间序列数据实现潜因子矩阵拟合,包括:MAFTIS模型下S作为U1,U2...U
N
和V1,V2...V
T
的目标函数,记S对U
i
的偏导为对V
j

偏导为则交替梯度下降法的求解过程包括:对i=1,2...N并令对j=1,2...T并令其中η1、η2表示学习率,以实现对矩阵U和V的更新;预设有n个用户在T个产品上有评分并形成一个n
×
T维的用户

产品评分矩阵Y,矩阵中的元素y
ij
表示用户i对产品j的评分,通过用户

产品评分矩阵中已知的评分来获取用户和产品的潜在特征矩阵,根据所得的潜在特征矩阵预测评分矩阵中的未知数;将用户

产品评分就诊Y中已知评分拟合获得矩阵和矩阵和矩阵使得成立,其中矩阵L表示用户的潜在特征矩阵,描述着n个用户的属性,矩阵S表示项目的潜在特征矩阵,描述T0个项目的属性,若Y服从均值为μ,方差为σ2的高斯分布的表达式为为其中R
ij
为指示函数,当其取值为1时表示用户i对产品进行了评分,反之则取值为0;若L服从期望为0,则方差的高斯分布的表达式为的高斯分布的表达式为若S服从期望为0,则方差的高斯分布的表达式为采用后验概率公式得到三个矩阵的联合分布的表达式为并取对数使最大化对数后的后验概率相当于最小化的表达式为验概率相当于最小化的表达式为其中而表示Frobenius范式,对高斯函数的均值施加logistic函数g(x)=1/(1+exp(

x)),其取值为0到1之间,最后的目标函数改写的表达式为1之间,最后的目标函数改写的表达式为使用梯度下降法通过求解L
i
、S
j
中的每个元素。4.根据权利要求1所述的基于大数据的销售信息预测方法,其特征在于,分别根据所述业务需求信息、历史销售数据选定预测产品和所述产品的预测销量以设定预测参数,包括:将预测参数设定为f,真实值记为y,序列第t期的真实值记为yt,第t期的预测值为Ft,则预测误差为et=yt

Ft,衡量预测精度的均方根误差RMSE的表达式为5.根据权利要求4所述的基于大数据的销售信息预测方法,其特征在于,还包括:预设y'为销售趋势热度,x1,x2...x
n
为一定时间产品的出库数量,c1,c2...c
n
为其对应的加权平均值,则销售趋势热度的表达式为y'=c1x1+c2x2+...c
n
x
n
;将因变量y0和p个回归变量x1,x2...x
n
分别建立一元回归方程的表达式为y0=β0x0+β
i
x
i
...

【专利技术属性】
技术研发人员:林乐新姜小康曹阳
申请(专利权)人:深圳闪新软件技术服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1