一种数据处理的方法和装置制造方法及图纸

技术编号:32798439 阅读:11 留言:0更新日期:2022-03-23 20:02
本发明专利技术公开了一种数据处理的方法和装置,涉及智慧物流技术领域。该方法的具体实施方式包括:确定待处理的时序数据;针对待处理的时序数据在位于历史目标时间段内的设定时间点存在数量突变点的情况,将待处理的时序数据分割出位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据;确定第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理第一时序数据以及与目标特征时序簇相匹配的第二数据处理模型处理第二时序数据;根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果。通过对不同时序数据采用不同的处理模型分别处理,以提高处理的准确性。以提高处理的准确性。以提高处理的准确性。

【技术实现步骤摘要】
一种数据处理的方法和装置


[0001]本专利技术涉及智慧供应链
,尤其涉及一种数据处理的方法和装置。

技术介绍

[0002]在零售行业中,物品需求情况的预测是供应链管理的基础,它起到了为库存补调及仿真提供输入数据的作用,其效果的好坏直接决定着后续模型结果的有效性。同时,预测数据也可以向供应链管理人员展示预测数据的预计情况,从而起到决策支持的作用。
[0003] 在现有零售行业中,常使用单一的FFORMA模型(Feature

based forecast model averaging)作为全量时序数据处理的数据处理模型对物品需求情况进行预测,但是单一的数据处理模型对于多种不同类型的时序数据无法进行区分,导致预测结果的准确性低。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种数据处理的方法和装置,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况进行分析,将待处理的时序数据分割成位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据,其中,所述数量突变点通过大数据统计学确定出,使得第一时序数据所包括的多个时间点的数据小于数量突变点的数值,第二时序数据所包括的多个时间点的数据等于或大于数量突变点的数值,后续通过第一数据处理模型和第二数据处理模型分别对第一时序数据和第二时序数据进行处理,即实现采用不同数据处理模型对不同阶段的不同数据进行处理,以使处理结果能够更真实反映不同阶段的物品需求情况,最后根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。通过上述方法可以达到通过采用不同的处理模型分别处理不同时序数据的目的,提高处理结果的准确性。
[0005]为实现上述目的,根据本专利技术实施例的第一方面,提供了一种数据处理的方法。
[0006]本专利技术实施例的数据处理的方法包括:确定待处理的时序数据;其中,所述待处理的时序数据指示在历史目标时间段内物品需求量变化情况;针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,将所述待处理的时序数据分割出位于所述设定时间点之前的第一时序数据以及位于所述设定时间点之后的第二时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;其中,所述数量突变点通过大数据统计学确定出;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。
[0007]可选地,在所述确定待处理的时序数据之后,进一步包括:针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点不存在数量突变点的情况,利用预设的所述第一数据处理模型处理所述待处理的时序数据;根据所述第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于所述第二预测结果设置所述预测时序内的物品库存。
[0008]可选地,所述第一数据处理模型的第一处理结果包括:所述预测时序内设定时间点之前的物品需求情况的预测结果;所述第二处理模型的处理结果包括:所述预测时序内设定时间点之后的物品需求情况的预测结果;所述确定预测时序内的物品需求情况的第一预测结果,包括:将所述预测时序内设定时间点之前的物品需求情况的预测结果与所述预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到所述第一预测结果。
[0009]可选地,在所述确定待处理的时序数据之后,进一步包括:在分析所述待处理的时序数据满足正态性假设的情况下,利用Buishand统计方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;在分析所述待处理的时序数据不满足正态性假设的情况下,利用Pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。
[0010]可选地,所述方法进一步包括:从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;从所述目标物品时序数据中分割出位于所述设定时间点之后的训练用第二时序数据训练用第二时序数据,其中,所述训练用第二时序数据所包括的多个时间点的数据等于或大于所述目标物品时序数据包括的数量突变点的数值;对所述训练用第二时序数据进行聚类,以得到一个或多个特征时序簇;所述确定所述第二时序数据所属的目标特征时序簇,包括:从一个或多个所述特征时序簇中,为所述第二时序数据选择出其所属目标特征时序簇。
[0011]可选地,所述为所述第二时序数据选择出其所属目标特征时序簇,包括:针对所述特征时序簇有多个的情况,将所述第二时序数据与各个所述特征时序簇进行匹配;根据匹配的结果,从多个所述特征时序簇筛选出目标特征时序簇。
[0012]可选地,所述方法进一步包括:从所述目标物品时序数据中分割出位于所述设定时间点之前的训练用第一时序数据,其中,所述训练用第一时序数据包括的多个时间点的数据小于所述目标物品时序数据包括的数量突变点的数值;对所述测试用例中除所述目标物品时序数据之外的其他物品时序数据与所述训练用第一时序数据进行聚类;利用聚类的结果训练预设的第一类待训练模型,得到第一数据处理模型,其中,所述第一类待训练模型基于一个或多个基模型配置得到,所述基模型包括ARIMA、ETS、Croston、简单移动平均、FBProphet、Holt

Winters、一阶指数平滑中的一种或多种。
[0013]可选地,所述方法还包括:针对每一种特征时序簇,利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型,得到与所述特征时序簇相匹配的第二数据处理模型,其中,所述第二类待训练模型基于一个或多个基模型配置得到,所述第二类待训练模型
与所述第一类待训练模型不同。
[0014]可选地,所述从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据,包括:针对所述测试用例中的每一种仓库物品标识的物品时序数据,执行如下操作:确定数据分割点;在所述数据分割点为所述仓库物品标识的物品时序数据的数量突变点的情况,确定所述仓库物品标识的物品时序数据为所述目标物品时序数据。
[0015]可选地,所述对所述训练用第二时序数据进行聚类,包括:为预设的距离函数确定序列平移函数和平移距离;利用确定出所述序列平移函数和所述平移距离的距离函数和DBSCAN算法对所述训练用第二时序数据进行聚类。
[0016]可选地,所述为所述第二时序数据选择出其所属目标特征时序簇,包括:对所述第二时序数据进行首尾拼接;将拼接后的结果分别与所述一个或多个特征时序簇进行匹配,将匹配值最高的特征时序簇作为所述目标特征时序簇。
[0017]可选地,所述利用所述特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理的方法,其特征在于,所述方法包括:确定待处理的时序数据;其中,所述待处理的时序数据指示在历史目标时间段内物品需求量变化情况;针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,将所述待处理的时序数据分割出位于所述设定时间点之前的第一时序数据以及位于所述设定时间点之后的第二时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;所述数量突变点通过大数据统计学确定出;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。2.根据权利要求1所述的方法,其特征在于,在所述确定待处理的时序数据之后,进一步包括:针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点不存在数量突变点的情况,利用预设的所述第一数据处理模型处理所述待处理的时序数据;根据所述第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于所述第二预测结果设置所述预测时序内的物品库存。3.根据权利要求1所述的方法,其特征在于,所述第一数据处理模型的第一处理结果包括:所述预测时序内设定时间点之前的物品需求情况的预测结果;所述第二处理模型的处理结果包括:所述预测时序内设定时间点之后的物品需求情况的预测结果;所述确定预测时序内的物品需求情况的第一预测结果,包括:将所述预测时序内设定时间点之前的物品需求情况的预测结果与所述预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到所述第一预测结果。4.根据权利要求2所述的方法,其特征在于,在所述确定待处理的时序数据之后,进一步包括:在分析所述待处理的时序数据满足正态性假设的情况下,利用Buishand统计方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;在分析所述待处理的时序数据不满足正态性假设的情况下,利用Pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。5.根据权利要求1所述的方法,其特征在于,进一步包括:从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;从所述目标物品时序数据中分割出位于所述设定时间点之后的训练用第二时序数据训练用第二时序数据,其中,所述训练用第二时序数据所包括的多个时间点的数据等于或
大于所述目标物品时序数据包括的数量突变点的数值;对所述训练用第二时序数据进行聚类,以得到一个或多个特征时序簇;所述确定所述第二时序数据所属的目标特征时序簇,包括:从一个或多个所述特征时序簇中,为所述第二时序数据选择出其所属目标特征时序簇。6.根据权利要求5所述的方法,其特征在于,所述为所述第二时序数据选择出其所属目标特征时序簇,包括:针对所述特征时序簇有多个的情况,将所述第二时序数据与各个所述特征时序簇进行匹配;根据匹配的结果,从多个所述特征时序簇筛选出目标特征时序簇。7.根据权利要求5所述的方法,其特征在于,进一步包括:从所述目标物品时序数据中分割出位于所述设定时间点之前的训练用第一时序数据,其中,所述训练用第一时序数据包括的多个时间点的数据小于所述目标物品时序数据包括的数量突变点的数值;对所述测试用例中除所...

【专利技术属性】
技术研发人员:陈家禹陈浪庄晓天吴盛楠
申请(专利权)人:北京京东振世信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1