【技术实现步骤摘要】
一种基于时间序列的缺失数据补充方法与系统
本专利技术属于一种基于时间序列的酒店缺失数据补充方法与系统,属于计算机软件
技术介绍
在现有技术方案中,用于酒店预测的数据通常要求是一个完整的时间序列,中间不能有延迟、缺失,以保证预测结果的准确性。而事实上,由于数据处理技术(数据的存储、收集、加工、转换)、数据传输、数据交接(企业间或部门间)等众多因素的限制使得数据挖掘人员获取的数据多多少少会存在一定程度的延迟或缺失。例如,由于某种原因A酒店可用于生产的数据比模型所需的数据少了一天。而如果直接利用这些不完整数据来建模,对于模型本身来说,造成的影响可能是模型不稳定或精度不高,而对于酒店来讲,这种影响可能是灾难性的,因为错误的模型预测结果对于酒店的经营策略反馈和酒店的实际经营数据对于模型的反馈之间会存在一个恶性循环的结果,从而给酒店带来不必要的的经济损失。然而对于缺少数据的补充,目前并没有一个比较好的解决方法。
技术实现思路
针对酒店不能提供全部历史数据或有数据延迟的的技术问题,本专利技术的目的在于提供一种基于时间序列的缺失数据补充方法与系统,以辅助酒店决策。本专利技术 ...
【技术保护点】
一种基于时间序列的缺失数据补充方法,其步骤包括:1)数据获取与处理模块获取基模型所需的历史数据,以及对所述历史数据中各时间点的历史数据进行特征提取并生成对应时间点的历史数据的数据列;所述时间点为构成时间序列的时间单元;2)基模型开发模块根据历史数据的数据列和待预测数据的数据列构建一基模型,用于对数据进行拟合进而达到回归预测;所述基模型为B(k)=(X
【技术特征摘要】
1.一种基于时间序列的缺失数据补充方法,其步骤包括:1)数据获取与处理模块获取基模型所需的历史数据,以及对所述历史数据中各时间点的历史数据进行特征提取并生成对应时间点的历史数据的数据列;所述时间点为构成时间序列的时间单元;2)基模型开发模块根据历史数据的数据列和待预测数据的数据列构建一基模型,用于对数据进行拟合进而达到回归预测;所述基模型为B(k)=(XTX+kI)-1XTY;其中,X为一时间点对应的历史数据的数据列,Y为待预测数据的数据列;k为惩罚系数,I为单位矩阵,B(k)为数据列X的特征所对应的回归系数;3)利用历史数据的数据列对基模型进行训练,再用训练好的基模型对待预测数据的数据列进行预测补齐。2.如权利要求1所述的方法,其特征在于,所述步骤3)中,对训练好的基模型的预测精度进行评估,评估指标为平均绝对误差MAPE;如果基模型的预测精度达不到设定条件,则查找基模型中数据对应的各日期对应的历史同期数据,将这些历史同期数据对应的数据列作为训练数据再次训练基模型。3.如权利要求2所述的方法,其特征在于,利用公式进行评估;其中,Mean为求均值函数,abs为求绝对值函数,true_value为真实值,pred_value为预测值。4.如权利要求2所述的方法,其特征在于,利用公式找到基模型中数据对应的各日期的历史同期;其中,k代表基模型中数据对应的一日期的浮动天数,y代表年,m代表月,d代表天。5.如权利要求1所述的方法,其特征在于,所述特征为所述时间点的不同提前预定天数。6.如权利要求1或5所述的方法,其特征在于,所述时间点为以年月日表示的日期。7.一种基于时...
【专利技术属性】
技术研发人员:许海军,戴宇超,暴筱,林小俊,
申请(专利权)人:北京众荟信息技术股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。