The present disclosure relates to a prediction model construction method and apparatus, and a real-time prediction method and apparatus. Model construction method includes the prediction: recognition in the training data to a variety of different patterns of association, the association of different model to describe the relationship between the effect of training data in a variety of factors and different target data; respectively trained using multiple sets of data associated with a variety of different modes corresponding to the prediction in order to get the sub model is suitable for various modes of Association; and according to the construction of association pattern transfer model of association between various modes of the training data, the association mode transfer model in the prediction process for determining a plurality of different prediction sub model and forecast the matching degree between the data. According to embodiments of the disclosure, can obtain a plurality of corresponding prediction models and various data characteristics, therefore in the forecast can weight data characteristics of each prediction model based on dynamic adjustment, so as to enhance the prediction accuracy.
【技术实现步骤摘要】
预测模型构建方法和设备以及实时预测方法和设备
本公开涉及预测
,更特别地涉及一种用于构建预测模型的方法和设备以及用于执行实时预测的方法和设备。
技术介绍
预测技术是当下的一个热点研究问题。预测技术可以在各个领域得到广泛应用,诸如空气质量预测、气候预测、交通流量预测等。根据数据的特点和预测的问题的不同,已经提出了各种不同的预测模型,例如基于参数的时间序列预测、神经网络、回归分析等。传统的预测模型通常采用全局建模的方式,即利用一个统一的模型涵盖各种预测过程,并对自变量与因变量之间的关系进行建模。然而,数据中变量间的关联模式随着时间、空间的不同通常有着较大变化,而这类统一的模型难以涵盖数据中的所有情况,尤其是数据中的稀有事件。而这些事件往往会是预测中需要特别关注的重点,例如空气质量预测中的重度污染预测、交通流中的事故预测等。传统的预测方法,如神经网络、回归分析等方法,通常首先采集一些真实数据作为样本,以用于训练模型,然后用训练好的模型进行预测。这样预测的准确度非常依赖于训练时所用样本数据的数量和质量。而且待预测的数据与训练样本特征差异较大时,其预测结果往往是不准确的。多模型预测是传统的空气质量预测多采用的预测方式,这种预测方式已经被证明是有效的。例如,在US6535817B1中公开了一种基于多回归模型的气候预测方式。根据该专利中提出的技术方案,在训练过程中,首先针对历史气候数据执行预处理,以使其满足模型的输入和输出形式;接着随机地将数据划分为N个分组;然后,针对这N个分组进行训练以得到相应的N个预测模型;随后,基于历史气候数据针对这N个相应的预测模型进行评 ...
【技术保护点】
一种用于构建预测模型的方法,包括:识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型;以及根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。
【技术特征摘要】
1.一种用于构建预测模型的方法,包括:识别待训练数据中的多种不同的关联模式,其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系;利用与所述多种不同的关联模式相对应的多组数据分别进行训练,以得到适用于所述多种不同的关联模式的多个子预测模型;以及根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型,其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。2.根据权利要求1所述的方法,其中所述识别待训练数据中的多种不同的关联模式包括:将所述待训练数据按照时间划分为多个数据分段;学习所述多个数据分段中的各个数据分段的关联模式;以及通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。3.根据权利要求2所述的方法,其中所述确定所述多种不同的关联模式包括:基于层次聚类对所述各个数据分段的关联模式进行聚类。4.根据权利要求1至3任一项所述的方法,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。5.根据权利要求4所述的方法,其中根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型包括:利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。6.一种用于执行实时预测的方法,包括:利用多个不同的子预测模型针对实时数据执行预测,以得到多个初始预测结果,其中所述多个不同的子预测模型分别适用于多种不同的关联模式;基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度;以及基于所述匹配度对所述多个初始预测结果进行加权平均,以确定针对所述实时数据的预测结果。7.根据权利要求6所述的方法,其中所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。8.根据权利要求6或7所述的方法,其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。9.根据权利要求8所述的方法,其中所述基于关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度包括:通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率,来确定所述匹配度。10.一种用于构建预测模型的设备,包括:模式识别模块,被配置用于识...
【专利技术属性】
技术研发人员:祁仲昂,刘博,胡卫松,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。