商品指标数据预测方法、装置、存储介质及电子设备制造方法及图纸

技术编号:24459312 阅读:23 留言:0更新日期:2020-06-10 16:31
本发明专利技术实施方式涉及一种商品指标数据预测方法、装置、存储介质与电子设备,涉及数据处理技术领域。该方法包括:获取待预测商品的历史指标数据,其包括在至少一个历史周期中的各单位时间内,统计关于待预测商品的用户行为所得到的指标数据;根据历史指标数据构建多层概率模型,并基于多层概率模型进行采样,得到用户行为发生在各单位时间内的概率分布样本;利用概率分布样本,确定在一个周期中,用户行为发生在各单位时间内的后验概率;基于后验概率,预测在未来至少一个单位时间内,待预测商品的指标数据。本发明专利技术适用于历史数据不完整的情况,且通过概率分布的方式对商品指标数据的变化规律进行表征,能够实现准确的预测。

Commodity index data prediction methods, devices, storage media and electronic equipment

【技术实现步骤摘要】
商品指标数据预测方法、装置、存储介质及电子设备
本专利技术的实施方式涉及数据处理
,更具体地,本专利技术的实施方式涉及一种商品指标数据预测方法、商品指标数据预测装置、计算机可读存储介质及电子设备。
技术介绍
本部分旨在为权利要求中陈述的本专利技术的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。企业在开展业务时,需要对商品未来的指标数据作出预测,例如预测电商商品的销量,以对采购、库存管理和营销活动策划等相关业务环节形成指导,预测视频网站中视频的播放量,以对后台的服务器与数据库等资源进行优化配置。现有技术中,商品指标数据预测大多采用时间序列分析法,如典型的ARIMA(AutoregressiveIntegratedMovingAverageModel,差分整合移动平均自回归模型)、Holt-Winters(霍尔特-温特,一种指数平滑法)等。时间序列分析法通过对商品指标数据中连续变化的规律进行分析,预测数据未来发展的趋势,从而得到未来某一时间的数据。
技术实现思路
然而,现有的时间序列分析法存在以下问题:需要对商品指标数据中连续变化的规律进行分析,因此对历史数据的完整性要求很高,如果历史数据中缺失一段,导致历史数据不连续,则对于分析结果影响很大;而实际应用中,由于缺货断货、商品日龄短、促销活动干扰等因素,历史数据的完整性往往难以满足要求;商品指标数据中一般存在不可预测的影响因素,导致数据变化具有一定的偶然性,这样在采用时间序列分析法时,难以对数据变化的规律进行拟合,导致分析结果不准确;由于不同商品的指标数据变化规律一般不同,因此需要对每种商品单独采用时间序列分析法进行建模分析,导致人力、时间与计算成本升高,应用时需要选择对应的模型,也较为不便,且单一商品上历史数据缺失的问题更加严重。为此,非常需要一种改进的商品指标数据预测方法,可以改善现有技术中的上述问题。在本上下文中,本专利技术的实施方式期望提供一种商品指标数据预测方法、商品指标数据预测装置、计算机可读存储介质及电子设备。根据本专利技术实施方式的第一方面,提供一种商品指标数据预测方法,包括:获取待预测商品的历史指标数据,所述历史指标数据包括:在至少一个历史周期中的各单位时间内,统计关于所述待预测商品的用户行为所得到的指标数据;根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本;利用所述概率分布样本,确定在一个周期中,所述用户行为发生在各单位时间内的后验概率;基于所述后验概率,预测在未来至少一个单位时间内,所述待预测商品的指标数据。在一种可选的实施方式中,所述根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本,包括:获取预设的所述用户行为的概率分布函数,并以所述概率分布函数的参数为底层参数,获取多层概率分布参数;根据所述多层概率分布参数中顶层参数的预设样本以及所述历史指标数据构建所述多层概率模型,并采样得到所述多层概率分布参数中每一层参数的样本;将所述底层参数的样本代入到所述概率分布函数中,采样得到所述概率分布样本。在一种可选的实施方式中,所述多层概率模型包括多层贝叶斯模型;所述多层概率分布参数包括三层概率分布参数,分别为所述底层参数、中间层参数和所述顶层参数;所述根据所述多层概率分布参数中顶层参数的预设样本以及所述历史指标数据构建所述多层概率模型,采样得到所述多层概率分布参数中每一层参数的样本,包括:获取多层贝叶斯模型的预设框架,所述预设框架基于所述概率分布函数和所述多层概率分布参数而预先建立;利用所述预设框架对所述顶层参数的预设样本以及所述历史指标数据进行处理,以构建所述多层贝叶斯模型,并通过马尔科夫链蒙特卡洛采样得到所述中间层参数的样本和所述底层参数的样本。在一种可选的实施方式中,所述多层贝叶斯模型包括:Xi~VonMises(μi,κi);μi~Normal(μμ,σμ);κi~HalfNormal(σκ);其中,Xi表示关于待预测商品i的所述用户行为的概率分布函数;Xi的似然是参数为μi和κi的循环正态分布,μi和κi为所述底层参数;μi的先验分布是参数为μμ和σμ的正态分布,κi的先验分布是参数为σκ的半正态分布,μμ、σμ和σκ为所述中间层参数;μμ的先验分布是参数为和的正态分布,σμ的先验分布是参数为的半正态分布,σκ的先验分布是参数为的半正态分布,和为所述顶层参数。在一种可选的实施方式中,所述根据所述历史指标数据构建多层概率模型,包括:根据所述历史周期中的各单位时间内的指标数据与所述历史周期的指标数据总量之比,得到所述用户行为的历史概率分布;根据所述历史概率分布构建所述多层概率模型。在一种可选的实施方式中,所述利用所述概率分布样本,确定在一个周期中,所述用户行为发生在各单位时间内的后验概率,包括:统计所述概率分布样本在各单位时间内的数值分布,以确定在一个周期中,所述用户行为发生在各单位时间内的后验概率。在一种可选的实施方式中,所述基于所述后验概率,预测在未来至少一个单位时间内,所述待预测商品的指标数据,包括:获取所述待预测商品在未来周期的指标总量预测值;基于所述后验概率和所述指标总量预测值,计算在所述未来周期中的各单位时间内,所述待预测商品的指标数据预测值。在一种可选的实施方式中,其特征在于,所述待预测商品包括以下任意一种或多种:电商商品、电子书、音乐、视频、网络游戏。在一种可选的实施方式中,所述指标数据包括以下任意一种或多种:销量、点击量、浏览量、收藏量、播放量。在一种可选的实施方式中,所述周期为年,所述单位时间为一年中的每一天;或者所述周期为天,所述单位时间为一天中的每一小时。根据本专利技术实施方式的第二方面,提供一种商品指标数据预测装置,包括:获取模块,用于获取待预测商品的历史指标数据,所述历史指标数据包括:在至少一个历史周期中的各单位时间内,统计关于所述待预测商品的用户行为所得到的指标数据;采样模块,用于根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本;后验模块,用于利用所述概率分布样本,确定在一个周期中,所述用户行为发生在各单位时间内的后验概率;预测模块,用于基于所述后验概率,预测在未来至少一个单位时间内,所述待预测商品的指标数据。在一种可选的实施方式中,所述采样模块,被配置为通过执行以下方法,以得到所述概率分布样本:获取预设的所述用户行为的概率分布函数,并以所述概率分布函数的参数为底层参数,获取多层概率分布参数;根据所述多层概率分布参数中顶层参数的预设样本以及所述历史指标数据构建所述多层概率模型,并采样得到所述多层概率分布参数中每一层参数的样本;将所述底层参数的样本代入到所述概率分布函数中,采样得到所述概率分布样本。...

【技术保护点】
1.一种商品指标数据预测方法,其特征在于,包括:/n获取待预测商品的历史指标数据,所述历史指标数据包括:在至少一个历史周期中的各单位时间内,统计关于所述待预测商品的用户行为所得到的指标数据;/n根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本;/n利用所述概率分布样本,确定在一个周期中,所述用户行为发生在各单位时间内的后验概率;/n基于所述后验概率,预测在未来至少一个单位时间内,所述待预测商品的指标数据。/n

【技术特征摘要】
1.一种商品指标数据预测方法,其特征在于,包括:
获取待预测商品的历史指标数据,所述历史指标数据包括:在至少一个历史周期中的各单位时间内,统计关于所述待预测商品的用户行为所得到的指标数据;
根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本;
利用所述概率分布样本,确定在一个周期中,所述用户行为发生在各单位时间内的后验概率;
基于所述后验概率,预测在未来至少一个单位时间内,所述待预测商品的指标数据。


2.根据权利要求1所述的方法,其特征在于,所述根据所述历史指标数据构建多层概率模型,并基于所述多层概率模型进行采样,得到所述用户行为发生在各单位时间内的概率分布样本,包括:
获取预设的所述用户行为的概率分布函数,并以所述概率分布函数的参数为底层参数,获取多层概率分布参数;
根据所述多层概率分布参数中顶层参数的预设样本以及所述历史指标数据构建所述多层概率模型,并采样得到所述多层概率分布参数中每一层参数的样本;
将所述底层参数的样本代入到所述概率分布函数中,采样得到所述概率分布样本。


3.根据权利要求2所述的方法,其特征在于,所述多层概率模型包括多层贝叶斯模型;所述多层概率分布参数包括三层概率分布参数,分别为所述底层参数、中间层参数和所述顶层参数;
所述根据所述多层概率分布参数中顶层参数的预设样本以及所述历史指标数据构建所述多层概率模型,采样得到所述多层概率分布参数中每一层参数的样本,包括:
获取多层贝叶斯模型的预设框架,所述预设框架基于所述概率分布函数和所述多层概率分布参数而预先建立;
利用所述预设框架对所述顶层参数的预设样本以及所述历史指标数据进行处理,以构建所述多层贝叶斯模型,并通过马尔科夫链蒙特卡洛采样得到所述中间层参数的样本和所述底层参数的样本。


4.根据权利要求3所述的方法,其特征在于,所述多层贝叶斯模型包括:
Xi~VonMises(μi,κi);
μi~Normal(μμ,σμ);
κi~HalfNormal(σκ);









其中,Xi表示关于待预测商品i的所述用户行为的概率分布函数;
Xi的似然是参数为μi和κi的循环正态分布,μi和κi为所述底层参...

【专利技术属性】
技术研发人员:肖伟集王迪邱显杨杰罗晓华
申请(专利权)人:杭州网易再顾科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1