建立预测模型的装置、方法及计算机可读存储介质制造方法及图纸

技术编号:17139153 阅读:38 留言:0更新日期:2018-01-27 14:55
本发明专利技术公开了一种基于时间序列建立预测模型的装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的预测模型建立程序,该程序被处理器执行时实现如下步骤:获取样本组的目标时间序列,从中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征;从中提取目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,并取均值和方差作为统计学特征;将多个样本组的特征输入预设分类/回归模型中训练,获取分类/回归模型的预测因子,以获取预测模型。本发明专利技术还提出一种基于时间序列建立预测模型的方法以及一种计算机可读存储介质。本发明专利技术降低了人工训练介入量,提高了基于时间序列创建的模型的可复用性。

A device, method and computer readable storage medium for building a prediction model

The invention discloses a device model based on time series prediction is established including: procedures for the establishment of prediction model of memory, processor and stored in memory and can be run on the processor, the program executed by the processor to achieve the following steps: acquiring the sample target time series, extracting time history data of M unit interval from the preset period, as an historical data extraction data characteristics; the target time unit of the n continuous time unit in the chain as data characteristics, and the mean and variance as statistical characteristics; multiple characteristics of input sample classification / regression model in the training set, the prediction factor regression model to obtain the classification / prediction model to obtain. The invention also presents a method for establishing a prediction model based on a time series and a computer readable storage medium. The invention reduces the amount of manual training intervention and improves the reusability of the model based on time series.

【技术实现步骤摘要】
建立预测模型的装置、方法及计算机可读存储介质
本专利技术涉及数据处理
,尤其涉及一种建立预测模型的装置、方法及计算机可读存储介质。
技术介绍
时间序列是一种十分常见的数据类型。几乎所有商业上的数据集,都有一个时间的维度。而很多商业的数据分析,例如股市的波动,某种疾病的发病率等,其数据具有随着时间的流动而发生变化的规律。传统的时间序列数据预测模型,例如自回归滑动平均模型,隐马尔可夫模型等,这些常用的模型的复用性较差,其建模流程往往需要较大量的人工参与样本训练,导致在不同场景下研究同类时间序列数据时,经常需要对模型进行适应性调整。
技术实现思路
本专利技术提供一种建立预测模型的装置、方法及计算机可读存储介质,其主要目的在于降低人工训练介入量,提高基于时间序列创建的模型的可复用性。为实现上述目的,本专利技术提供一种基于时间序列建立预测模型的装置,该装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的预测模型建立程序,所述预测模型建立程序被所述处理器执行时实现如下步骤:获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征,其中,m≥1;从所述目标时间序列中提取所述目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,其中,n≥1;对所述环比数据特征取均值和方差,作为统计学特征;将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;获取所述分类/回归模型的预测因子,将确定预测因子后的预设分类/回归模型作为预测模型。可选地,所述处理器还用于执行所述预测模型建立程序,以在所述获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征的步骤之前,以实现如下步骤:对获取的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列。可选地,所述处理器还用于执行所述预测模型建立程序,以在所述对输入的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列的步骤之前,还实现以下步骤:接收输入的所述待测项目的历史数据,基于时间维度整理所述历史数据,以生成所述待测项目的原始时间序列。可选地,所述将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量的步骤包括:按照预设的特征选择算法,对因变量进行特征筛选处理获取特征子集;其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;将所述特征子集作为训练样本输入到预设分类模型中进行训练。可选地,所述对获取的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序的步骤包括:按照预设的窗口长度对所述原始时间序列作滑动平均处理得到滑动平均序列;按照预设的数据标准化算法对所述滑动平均序列进行标准化处理,以获取所述标准时间序列。此外,为实现上述目的,本专利技术还提供一种基于时间序列建立预测模型的方法,该方法包括:获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征,其中,m≥1;从所述目标时间序列中提取所述目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,其中,n≥1;对所述环比数据特征取均值和方差,作为统计学特征;将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;获取所述分类/回归模型的预测因子,将确定预测因子后的预设分类/回归模型作为预测模型。可选地,所述获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征的步骤之前,所述方法还包括:对获取的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列。可选地,所述对输入的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列的步骤之前,所述方法还包括:接收输入的所述待测项目的历史数据,基于时间维度整理所述历史数据,以生成所述待测项目的原始时间序列。可选地,所述将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量的步骤包括:按照预设的特征选择算法,对因变量进行特征筛选处理获取特征子集;其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;将所述特征子集作为训练样本输入到预设分类模型中进行训练。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有预测模型建立程序,所述预测模型建立程序被处理器执行时实现如上所述的基于时间序列建立预测模型的方法的步骤。本专利技术提出的建立预测模型的装置、方法及计算机可读存储介质,获取样本组的目标时间序列,以目标时间单元为基准从该目标时间序列中提取m个间隔预设周期的时间单元的历史数据作为同比数据特征,从中提取该目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,然后对该环比数据特征取均值和方差作为统计学特征,按照上述过程分别获取多个样本组的同比数据特征、环比数据特征和统计学特征,将多个样本组的上述特征输入到预设的分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量,获取分类/回归模型的预测因子,将确定了预测因子的分类/回归模型作为预测模型,本专利技术在基于时间序列进行训练建模时,不需要人工参与样本的训练,能够对输入的目标时间序列进行特征提取,进而获取多个样本组的特征,将其输入到分类/回归模型中进行训练并生成预测因子,将确定了预测因子的分类/回归模型作为预测模型,可以用于其他场景的与样本组相同类型的时间序列的预测,提高了预测模型的可复用性。附图说明图1为本专利技术基于时间序列建立预测模型的装置较佳实施例的示意图;图2为本专利技术基于时间序列建立预测模型的方法第一实施例的流程图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种基于时间序列建立预测模型的装置。参照图1所示,为本专利技术基于时间序列建立预测模型的装置较佳实施例的示意图。在本实施例中,基于时间序列建立预测模型的装置可以是PC(PersonalComputer,个人电脑),也可以是智能手机、平板电脑、便携计算机等可移动式终端设备。该基于时间序列建立预测模型的装置包括存储器11、处理器12,通信总线13,以及网络接口14。其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体本文档来自技高网...
建立预测模型的装置、方法及计算机可读存储介质

【技术保护点】
一种基于时间序列建立预测模型的装置,其特征在于,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的预测模型建立程序,所述预测模型建立程序被所述处理器执行时实现如下步骤:获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征,其中,m≥1;从所述目标时间序列中提取所述目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,其中,n≥1;对所述环比数据特征取均值和方差,作为统计学特征;将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;获取所述分类/回归模型的预测因子,将确定预测因子后的预设分类/回归模型作为预测模型。

【技术特征摘要】
1.一种基于时间序列建立预测模型的装置,其特征在于,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的预测模型建立程序,所述预测模型建立程序被所述处理器执行时实现如下步骤:获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征,其中,m≥1;从所述目标时间序列中提取所述目标时间单元前的n个连续的时间单元的历史数据,作为环比数据特征,其中,n≥1;对所述环比数据特征取均值和方差,作为统计学特征;将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;获取所述分类/回归模型的预测因子,将确定预测因子后的预设分类/回归模型作为预测模型。2.根据权利要求1所述的基于时间序列建立预测模型的装置,其特征在于,所述处理器还用于执行所述预测模型建立程序,以在所述获取样本组的目标时间序列,以目标时间单元为基准,从所述目标时间序列中提取m个间隔预设周期的时间单元的历史数据,作为同比数据特征的步骤之前,以实现如下步骤:对获取的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列。3.根据权利要求2所述的基于时间序列建立预测模型的装置,其特征在于,所述处理器还用于执行所述预测模型建立程序,以在所述对输入的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列作为所述目标时间序列的步骤之前,还实现以下步骤:接收输入的所述待测项目的历史数据,基于时间维度整理所述历史数据,以生成所述待测项目的原始时间序列。4.根据权利要求1至3中任一项所述的基于时间序列建立预测模型的装置,其特征在于,所述将获取的多个样本组的特征输入到预设分类/回归模型中进行训练,其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量的步骤包括:按照预设的特征选择算法,对因变量进行特征筛选处理获取特征子集;其中,将所述目标时间单元对应的特征为目标变量,并将特征中除目标变量外的其他特征作为因变量;将所述特征子集作为训练样本输入到预设分类模型中进行训练。5.根据权利要求2所述的基于时间序列建立预测模型的装置,其特征在于,所述对获取的原始时间序列作滑动平均处理和标准化处理得到标准时间序列,将所述标准时间序列...

【专利技术属性】
技术研发人员:徐亮李弦吴双双肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1