一种交互式数据预测方法和系统技术方案

技术编号:39748180 阅读:6 留言:0更新日期:2023-12-17 23:46
本发明专利技术公开了一种交互式数据预测方法和系统,通过根据用户数据进行聚类分析生成若干个聚类簇并针对每个聚类簇建立第三数据的时序预测系统,计算预测数据漂移程度并通过向用户请求数据更新来修正聚类簇对应的时序预测系统,从而可更精确地预测区域范围内的物料需求以及波动,从而更精确地调整计划库存量

【技术实现步骤摘要】
一种交互式数据预测方法和系统


[0001]本专利技术涉及大数据处理领域,具体涉及一种交互式数据预测方法和系统


技术介绍

[0002]以往汽车相关服务厂商在做库存准备时,通常根据历史库存情况制定计划,以避免库存量与需求量偏差较大

然而,在计算预测库存使用情况时,往往只能根据历史用量和历史价格走势进行估算,因此只能从宏观价格上进行推测计算

由于全球市场将近
70
%的天然橡胶均用于制造轮胎,因此两者具有强相关性,例如利用天然橡胶期货主力合约价格进行推算,从而得到轮胎的计划库存量

[0003]然而,期货价格具有周期性但并不具有地域性,具体到某些具体厂商,例如某个地域的
4S
店的轮胎需求量,则无法仅仅根据期货价格来预测和制定库存计划


技术实现思路

[0004]由于现有方法存在上述问题,本专利技术提出一种交互式数据预测方法,包括以下步骤:
[0005]A、
获取当前数据库中用户数据,所述用户数据包括用于表征用户属性的第一数据

用于表征非用户属性的第二数据以及用于表征物料磨损的第三数据;
[0006]B、
根据用户数据进行聚类分析,生成若干个聚类簇;
[0007]C、
针对每个聚类簇建立第三数据的时序预测系统;
[0008]D、
获取最新时间的用户数据;
[0009]E、
根据最新时间的第三数据计算每个聚类簇对应的时序预测系统的预测数据漂移程度;
[0010]F、
确定预测数据漂移程度大于设定阈值时,修正聚类簇对应的时序预测系统,具体包括:向对应聚类簇的用户发送数据更新请求,并基于用户返回的数据重新执行步骤
C

E

[0011]G、
基于聚类簇对应的修正后的时序预测系统计算预设时间的第三数据;
[0012]H、
基于第三数据预测物料价格并调整预设时间的计划库存量

[0013]进一步,所述预测数据漂移程度
[0014]其中
M
为时序预测系统中测试集的用户集合,
r
u
为用户
u
实际的第三数据,
p
u
为用户
u
在训练集上的预测结果

[0015]进一步,所述预测数据漂移程度
[0016]其中
M
为时序预测系统中测试集的用户集合,
r
u
为用户
u
实际的第三数据,
p
u
为用户
u
在训练集上的预测结果

[0017]进一步,所述预测数据漂移程度
[0018][0019]其中
M
为时序预测系统中测试集的用户集合,
r
u
为用户
u
实际的第三数据,
p
u
为用户
u
在训练集上的预测结果
,w
u
为基于用户属性的权重函数

[0020]进一步,基于用户属性的权重函数
[0021]其中
t
u
为用户
u
的上一次用户数据中第一数据更新时间,
t0为目标用户最新采样时间,
T
为当前数据库中用户数据时间跨度

[0022]进一步,所述步骤
F
中所述的修正聚类簇对应的时序预测系统,
[0023]具体为:
[0024]向对应聚类簇的用户发送数据更新请求;
[0025]基于用户返回的数据重新执行步骤
C

E。
[0026]进一步,所述针对每个聚类簇建立第三数据的时序预测系统具体为:
[0027]获取任一聚类簇中的训练数据集,所述训练数据集特征向量只有一维,所述特征向量的特征变量为时间;
[0028]为所述特征变量选择切分点
S
i
,所述切分点
S
i
为所述训练数据集中两个相邻数据特征变量的平均值,计算所述切分点
S
i
两侧区间的平方误差和,并将使所述平方误差和最小的切分点作为第一最优切分点,所述使平方误差和最小的计算公式为:
[0029][0030]其中:
N1为最小特征变量值至切分点之间的所述训练数据数量,
N2为切分点至最大特征变量值之间的所述训练数据数量,所述所述切分点两侧区间指所述切分点与所述最小特征变量值和最大特征变量值之间的数据

[0031]基于所述第一最优切分点,在所述最小特征变量值与所述第一最优切分点之间继续调用所述使平方误差和最小的计算公式,得到在最小特征变量值与所述第一最优切分点之间的第二最优切分点;在所述最大特征变量值与所述第一最优切分点之间继续调用所述使平方误差和最小的计算公式,得到在最大特征变量值与所述第一最优切分点之间的第三最优切分点;
[0032]依次不断迭代所述使平方误差和最小的计算公式,计算得到第
N
切分点之间区间的第
N
最优切分点,直到相邻切分点之间的数据数量为3个;
[0033]依据所述最优切分点计算各自的值,得到回归树,并依据所述特征变量在所述回归树中的取值作为时序预测系统的输出值,所述回归树为:
[0034][0035]其中,
S
N1
为所述
N
个最优切分点由小到大排列中最小的最优切分点,
S
Nn
为所述
N
个最优切分点由小到大排列中最大的最优切分点

[0036]本专利技术还提出一种基于预测系统的数据分析系统,包括:
[0037]数据库,存储有用户数据,所述用户数据包括用于表征用户属性的第一数据

用于表征非用户属性的第二数据以及用于表征物料磨损的第三数据;
[0038]数据分析模块,用于:
[0039]根据用户数据进行聚类分析,生成若干个聚类簇;
[0040]针对每个聚类簇建立第三数据的时序预测系统;
[0041]获取最新时间的用户数据;
[0042]根据最新时间的第三数据计算每个聚类簇对应的时序预测系统的预测数据漂移程度;
[0043]确定预测数据漂移程度大于设定阈值时,修正聚类簇对应的时序预测系统,具体包括:向对应聚类簇的用户发送数据更新请求,并基于用户返回的数据重新执行步骤
C

E

[0044]基于聚类簇对应的修正后的时序预测系统计算预设时间的第三数据;
[0045]基于第三数据预测物料价格并调整预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种交互式数据预测方法,其特征在于,包括以下步骤:
A、
获取当前数据库中用户数据,所述用户数据包括用于表征用户属性的第一数据

用于表征非用户属性的第二数据以及用于表征物料磨损的第三数据;
B、
根据用户数据进行聚类分析,生成若干个聚类簇;
C、
针对每个聚类簇建立第三数据的时序预测系统;
D、
获取最新时间的用户数据;
E、
根据最新时间的第三数据计算每个聚类簇对应的时序预测系统的预测数据漂移程度;
F、
确定预测数据漂移程度大于设定阈值时,修正聚类簇对应的时序预测系统,具体包括:向对应聚类簇的用户发送数据更新请求,并基于用户返回的数据重新执行步骤
C

E

G、
基于聚类簇对应的修正后的时序预测系统计算预设时间的第三数据;
H、
基于第三数据预测物料价格并调整预设时间的计划库存量
。2.
根据权利要求1所述的交互式数据预测方法,其特征在于,所述步骤
C
具体为:获取任一聚类簇中的训练数据集,所述训练数据集特征向量只有一维,所述特征向量的特征变量为时间;为所述特征变量选择切分点
S
i
,所述切分点
S
i
为所述训练数据集中两个相邻数据特征变量的平均值,计算所述切分点
S
i
两侧区间的平方误差和,并将使所述平方误差和最小的切分点作为第一最优切分点,所述使平方误差和最小的计算公式为:其中:
N1为最小特征变量值至切分点之间的所述训练数据数量,
N2为切分点至最大特征变量值之间的所述训练数据数量,所述所述切分点两侧区间指所述切分点与所述最小特征变量值和最大特征变量值之间的数据

基于所述第一最优切分点,在所述最小特征变量值与所述第一最优切分点之间继续调用所述使平方误差和最小的计算公式,得到在最小特征变量值与所述第一最优切分点之间的第二最优切分点;在所述最大特征变量值与所述第一最优切分点之间继续调用所述使平方误差和最小的计算公式,得到在最大特征变量值与所述第一最优切分点之间的第三最优切分点;依次不断迭代所述使平方误差和最小的计算公式,计算得到第
N
切分点之间区间的第
N
最优切分点,直到相邻切分点之间的数据数量为3个;依据所述最优切分点计算各自的值,得到回归树,并依据所述特征变量在所述回归树中的取值作为时序预测系统的输出值,所述回归树为:
其中,
S
N1
为所述
N
个最优切分点由小到大排列中最小的最优切分点,...

【专利技术属性】
技术研发人员:王征宇王睿梁天爵乐进
申请(专利权)人:广东省信息网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1