预测方法和预测装置制造方法及图纸

技术编号:21116793 阅读:16 留言:0更新日期:2019-05-16 09:18
本公开公开了一种预测方法和预测装置,涉及计算机领域。其中的方法包括:根据预测模型的预测值和真实值确定预测误差序列;去除预测误差序列中的异常值;计算剩余的预测误差序列的均值;利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。从而,利用历史预测误差数据,对待预测值进行补偿,提高预测的准确性。

Prediction methods and devices

【技术实现步骤摘要】
预测方法和预测装置
本公开涉及计算机领域,特别涉及一种预测方法和预测装置。
技术介绍
随着科学技术的发展及预测需求的增大,越来越多的预测模型被提出并且应用。预测模型的目标是预测值尽可能的等于实际值。然而,现实的情况是,预测值与实际值经常不相等。预测值与实际值的差值就是这些预测模型的预测误差。
技术实现思路
专利技术人发现,由于现实情况的随机性,或者,由于不同预测模型里面考虑的特征各异,导致总有一些没有发现的特征未被考虑进去等原因,造成出现预测误差,影响预测的准确性。本公开实施例所要解决的一个技术问题是:提高预测的准确性。根据本公开的一个方面,提出一种预测方法,包括:根据预测模型的预测值和真实值确定预测误差序列;去除预测误差序列中的异常值;计算剩余的预测误差序列的均值;利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。可选地,所述去除预测误差序列中的异常值包括:计算预测误差序列的均值和标准差;根据预测误差序列的均值和标准差确定预测误差的合理范围;去除预测误差序列中在合理范围之外的预测误差。可选地,预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。可选地,所述去除预测误差序列中的异常值包括:利用预测误差序列确定线性回归模型;去除预测误差序列中偏离线性回归模型超过预设范围的预测误差。可选地,预测模型的待预测值减去剩余的预测误差序列的均值作为预测模型补偿后的待预测值。可选地,预测模型例如包括:神经网络模型、移动平均模型、梯度提升决策树、随机森林决策树等,但不限于所举示例。根据本公开的再一个方面,提出一种预测装置,包括:误差序列模块,用于根据预测模型的预测值和真实值确定预测误差序列;序列处理模块,用于去除预测误差序列中的异常值;补偿模块,用于计算剩余的预测误差序列的均值;利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。可选地,所述序列处理模块包括:第一序列处理单元或第二序列处理单元;所述第一序列处理单元,用于计算预测误差序列的均值和标准差;根据预测误差序列的均值和标准差确定预测误差的合理范围;去除预测误差序列中在合理范围之外的预测误差;所述第二序列处理单元,用于利用预测误差序列确定线性回归模型;去除预测误差序列中偏离线性回归模型超过预设范围的预测误差。可选地,所述第一序列处理单元中的预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。可选地,所述补偿模块,用于将预测模型的待预测值减去剩余的预测误差序列的均值作为预测模型补偿后的待预测值。根据本公开的另一方面,提出一种预测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述的预测方法。根据本公开的又一方面,提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的预测方法的步骤。本公开利用历史预测误差数据,对待预测值进行补偿,提高预测的准确性。附图说明下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本公开预测方法一个实施例的流程示意图。图2为本公开去除预测误差序列中的异常值的一个实施例的流程示意图。图3为本公开去除预测误差序列中的异常值的再一个实施例的流程示意图。图4为本公开预测装置一个实施例的结构示意图。图5为本公开预测装置另一个实施例的结构示意图。图6为本公开预测装置再一个实施例的结构示意图。具体实施方式下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。为了提高预测的准确性,提出本公开。图1为本公开预测方法一个实施例的流程示意图。如图1所示,本实施例的预测方法10包括:步骤110,根据预测模型的预测值和真实值确定预测误差序列。其中,预测模型例如包括:神经网络模型、移动平均模型、梯度提升决策树、随机森林决策树等,但不限于所举示例。通常情况下,预测模型先经过训练,然后再被用来预测。预测模型的训练和预测可以参考现有技术。其中,预测值与实际值的差值就是这些预测模型的预测误差。多组预测值与实际值的差值序列就是这些预测模型的预测误差序列。预测误差序列通常可以是历史预测误差数据,即根据预测模型的历史预测值和历史真实值确定历史预测误差序列。步骤120,去除预测误差序列中的异常值。在预测误差序列中,与大部分的预测误差表现不同的少数预测误差,可以视为预测误差序列中的异常值。因此,根据大部分的正常预测误差确定预测误差的一个合理范围,将合理范围之外的预测误差确定为异常值,并去除。步骤130,计算剩余的预测误差序列的均值。假设n个预测误差的序列ε1,ε2,...,εn去除异常值后剩余m个预测误差ε'1,ε'2,...,ε'm。根据中心极限定理,随着剩余的预测误差序列的样本足够多时,剩余的预测误差序列是服从正态分布的,可以参考后续的公式1和公式2,计算剩余的预测误差序列的均值(设为μ')和标准差(设为σ')。步骤140,利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。在一个实施例中,预测模型的待预测值减去剩余的预测误差序列的均值作为预测模型补偿后的待预测值。本实施例利用历史预测误差数据,对待预测值进行补偿,提高预测的准确性。本公开还提出两种示例性的去除预测误差序列中的异常值的方法。图2为本公开去除预测误差序列中的异常值的一个实施例的流程示意图。如图2所示,该实施例去除预测误差序列中的异常值的方法20包括:步骤210,假设获得了n个预测误差的序列ε1,ε2,...,εn,根据中心极限定理,每次的预测误差均是互相独立的随机变量,随着预测误差序列的样本足够多时,预测误差序列是服从正态分布的,可以据此计算预测误差序列的均值(设为μ)和标准差(设为σ)。此外,根据大数定理,随着预测误差序列的样本足够多时,样本的均值接近总体的均值,据此可以用预测误差序列的均值来代表预测误差的均值。步骤220,根据预测误差序列的均值和标准差确定预测误差的合理范围。其中,预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。公式表示如下:μ-p×σ<ε<μ+p×σ(公式3)其中,p×σ表示根据预测误差序列的标准差所确定的浮动范围,p为浮动系数,其数值例如为0.5,1,1.5,2,3等,但先不限于所举示例,p越大,预测误差的合理范围越大,去除的预测误差越少,可根据业务需要设置p的值。例如,p=1时,约去除35%的预测误差,约65%的预测误差被保留下来。步骤230,去除预测误差序列中在合理范围之外的预测误差。例如,ε1,ε2,...,εn中不在公式3所示合理范围中的预测误差将被去除。从而,根据中心极限定理和大数定理,去除了预测误差序列中的异常值。图3为本公开去除预测误差序列中的异常值的再一个实施例的流程示意图。如图3所示,该实施例去除预测误差序列中的异常值的方法30包括:步骤310,利用预测误差序列确定线性回归模型。例如,利用预测误差序列,利用预测误差序列,可本文档来自技高网...

【技术保护点】
1.一种预测方法,包括:根据预测模型的预测值和真实值确定预测误差序列;去除预测误差序列中的异常值;计算剩余的预测误差序列的均值;利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。

【技术特征摘要】
1.一种预测方法,包括:根据预测模型的预测值和真实值确定预测误差序列;去除预测误差序列中的异常值;计算剩余的预测误差序列的均值;利用剩余的预测误差序列的均值对预测模型的待预测值进行补偿。2.如权利要求1所述的方法,所述去除预测误差序列中的异常值包括:计算预测误差序列的均值和标准差;根据预测误差序列的均值和标准差确定预测误差的合理范围;去除预测误差序列中在合理范围之外的预测误差。3.如权利要求2所述的方法,其中,预测误差的合理范围为预测误差序列的均值加上或减去根据预测误差序列的标准差所确定的浮动范围。4.如权利要求1所述的方法,所述去除预测误差序列中的异常值包括:利用预测误差序列确定线性回归模型;去除预测误差序列中偏离线性回归模型超过预设范围的预测误差。5.如权利要求1所述的方法,其中,预测模型的待预测值减去剩余的预测误差序列的均值作为预测模型补偿后的待预测值。6.如权利要求1所述的方法,其中,预测模型包括:神经网络模型、移动平均模型、梯度提升决策树、随机森林决策树。7.一种预测装置,包括:误差序列模块,用于根据预测模型的预测值和真实值确定预测误差序列;序列处理模块,用于去除预测误差序列中的异常值;补...

【专利技术属性】
技术研发人员:崔汝伟
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1