【技术实现步骤摘要】
样本数据预测方法、装置和计算机可读介质
本专利技术涉及数据处理
,特别涉及样本数据预测方法、装置和计算机可读介质。
技术介绍
对于能源企业来说,需要对未来一段时间的煤炭销量进行预测,这样有助于能源企业准确的制定采购计划,合理安排资金周,进行库存管理以及确定生产决策等,从而把握对未来销量以便进行有效管控。现有技术中的煤炭销量数据预测方法,人工预测主观性较强,而且对决策人员的市场经验、战略眼光有较高的要求,一般是通过将能源企业历年的销量数据作为样本,采用的普通数据预处理方法不能准确的反映缺失数据的真实值,从而无法客观、准确的预测煤炭销量数据。
技术实现思路
本专利技术提供了样本数据预测方法、装置和计算机可读介质,能够客观准确地预测样本数据。第一方面,本专利技术实施例提供了样本数据预测方法,包括:获取样本数据,确定所述样本数据是否为连续,其中,所述样本数据包括预设时长的历史数据;如果所述样本数据连续,则确定所述样本数据为连续样本数据;对所述连续样本数据进行平稳性检验,并获得 ...
【技术保护点】
1.样本数据预测方法,其特征在于,包括:/n获取样本数据,确定所述样本数据是否为连续,其中,所述样本数据包括预设时长的历史数据;/n如果所述样本数据连续,则确定所述样本数据为连续样本数据;/n对所述连续样本数据进行平稳性检验,并获得所述连续样本数据的差分次数;/n对所述连续样本数据进行分解,并根据分解后的所述连续样本数据确定自回归项数和移动平均项数;/n根据所述差分次数、所述自回归项数和所述移动平均项数,构建ARIMA模型;/n根据所述连续样本数据对所述ARIMA模型进行拟合,以获得目标ARIMA模型;/n利用所述目标ARIMA模型对在所述连续样本数据所对应的时间之后的数据 ...
【技术特征摘要】
1.样本数据预测方法,其特征在于,包括:
获取样本数据,确定所述样本数据是否为连续,其中,所述样本数据包括预设时长的历史数据;
如果所述样本数据连续,则确定所述样本数据为连续样本数据;
对所述连续样本数据进行平稳性检验,并获得所述连续样本数据的差分次数;
对所述连续样本数据进行分解,并根据分解后的所述连续样本数据确定自回归项数和移动平均项数;
根据所述差分次数、所述自回归项数和所述移动平均项数,构建ARIMA模型;
根据所述连续样本数据对所述ARIMA模型进行拟合,以获得目标ARIMA模型;
利用所述目标ARIMA模型对在所述连续样本数据所对应的时间之后的数据进行预测,以获得预测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述连续样本数据进行分解,并根据分解后的所述连续样本数据确定自回归项数和移动平均项数,包括:
对所述连续样本数据按照趋势因素进行分解,并根据分解后的所述连续样本数据确定第一自回归项数和第一移动平均项数;
对所述连续样本数据按照季节因素进行分解,并根据分解后的所述连续样本数据确定第二自回归项数和第二移动平均项数;
对所述连续样本数据按照随机因素进行分解,并根据分解后的所述连续样本数据确定第三自回归项数和第三移动平均项数。
3.根据权利要求2所述的方法,其特征在于,
所述根据所述差分次数、所述自回归项数和所述移动平均项数,构建ARIMA模型,包括:
根据所述差分次数、所述第一自回归项数和所述第一移动平均项数,构建第一ARIMA模型;
根据所述差分次数、所述第二自回归项数和所述第二移动平均项数,构建第二ARIMA模型;
根据所述差分次数、所述第三自回归项数和所述第三移动平均项数,构建第三ARIMA模型;
所述根据所述连续样本数据对所述ARIMA模型进行拟合,以获得目标ARIMA模型,包括:
根据所述连续样本数据对所述第一ARIMA模型进行拟合,以获得第一目标ARIMA模型;
根据所述连续样本数据对所述第二ARIMA模型进行拟合,以获得第二目标ARIMA模型;
根据所述连续样本数据对所述第三ARIMA模型进行拟合,以获得第三目标ARIMA模型;
根据所述第一目标ARIMA模型、所述第二目标ARIMA模型和所述第三目标ARIMA模型,确定所述目标ARIMA模型。
4.根据权利要求2所述的方法,其特征在于,在所述确定所述样本数据是否为连续之后,进一步包括:
如果所述样本数据不连续,则利用三次指数平滑法对所述样本数据中缺失的数据进行填充;
其中,所述三次指数平滑法所采用的公式为:
其中,i用于表征所述样本数据中每一个数据的日期时间,h用于表征缺失数据所对应的日期时间与每一个数据的日期时间的间隔时长,i+h用于表征缺失数据所对应的日期时间,xi+h用于表征所述预测日期时间所对应的缺失数据,用于表征所述样本数据的趋势因素,用于表征所述样本数据的季节因素,k用于表征所述季节因素所对应的周期长度。
5.根据权利要求1-4中任一所述的方法,其特征在于,所述对所述连续样本数据进行平稳性检验,并获得所述连续样本数据的差分次数,包括:
S1:对所述连续样本数据进行时序图检验和自相关检验,获得初步检测结果;
S2:对所述连续样本数据进行单位根检验,在检测到所述连续样本数据平稳且所述初步检测结果为平稳时,执行S4,否则执行S3;
S3:对所述连续样本数据进行差分处理,记录进行差分处理的次数,并执行S1;
S4:获得所述连续样本数据的差分次数。
...
【专利技术属性】
技术研发人员:王圣茂,刘峰,孙庆恩,刘菲,陈华,
申请(专利权)人:浪潮通用软件有限公司,淮北矿业集团有限责任公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。