【技术实现步骤摘要】
基于stacking集成学习算法的时空数据预测建模方法
本专利技术涉及数据处理
,尤其是一种基于stacking集成学习算法的时空数据预测建模方法。
技术介绍
时空数据是同时具有时间和空间维度的数据,现实世界中的数据超过80%与地理位置有关。随着世界变得仪器化和相互联系,时空数据比以往任何时候都更加普遍和丰富,而通过时空数据预测技术获取时空数据中的复杂模式对时空数据研究应用来说也变得更加重要且紧迫。由GPS设备记录的移动物体(如出租车)轨迹,具有位置标记和时间戳的社交事件(如微博,犯罪)和环境监测是典型的时空数据。这些新兴的时空数据也给数据分析研究带来了新的挑战和机遇。一方面,数据在空间上存在异质性及自相关性,需要处理空间异质性和空间关系(例如拓扑关系,方向关系等)。另一方面,时空数据在时间上是动态的,需要对时空自相关和约束进行显式或隐式建模以实现良好的预测性能。时空序列数据是一种非常重要的时空数据。研究中通常将时空序列数据看作是在空间有相关关系的时间序列集合进行研究,产生了大量的方法。包括:时空自回归移动平均模型(Spatio-TemporalAutore ...
【技术保护点】
1.基于stacking集成学习算法的时空数据预测建模方法,其特征在于包括以下步骤:A、针对时空数据预测任务的需要,提取一段历史时间内的时空源数据;B、对提取的时空源数据进行时空数据处理得到时间、空间或时空维度上的动态特征数据集;C、设置时间分割点T0,将步骤B得到的动态特征数据集分为第一层数据集Data1和第二层数据集Data2,第一层数据集Data1和第二层数据集Data2的分割标准为:若动态特征数据集中的数据所对应的时间小于时间分割点T0,则将该数据划分至第一层数据集Data1中,动态特征数据集中的数据所对应的时间大于时间分割点T0,则将该数据划分至第二层数据集Dat ...
【技术特征摘要】
1.基于stacking集成学习算法的时空数据预测建模方法,其特征在于包括以下步骤:A、针对时空数据预测任务的需要,提取一段历史时间内的时空源数据;B、对提取的时空源数据进行时空数据处理得到时间、空间或时空维度上的动态特征数据集;C、设置时间分割点T0,将步骤B得到的动态特征数据集分为第一层数据集Data1和第二层数据集Data2,第一层数据集Data1和第二层数据集Data2的分割标准为:若动态特征数据集中的数据所对应的时间小于时间分割点T0,则将该数据划分至第一层数据集Data1中,动态特征数据集中的数据所对应的时间大于时间分割点T0,则将该数据划分至第二层数据集Data2中;D、将第一层数据集中的数据随机拆分成n份,得到数据集{data11,data12,…,data1n};E、将数据集数据集{data11,data12,…,data1n}中的每个子集data1i(i∈[1,n])为训练样本,进行base模型的训练,得到base模型集合{basem1,basem2,…,basemn};F、利用c预测第二层数据集Data2的结果{pred1,pred2,…,predn};G、将第二层数据集Data2的静态空间特征、base模型的预测结果{pred1,pred2,…,predn}融合成高阶特征数据集NewData2;H、在NewData2数据集上训练stacking模型,得到stackm模型;I、将训练好的第一层{basem1,basem2,…,basemn}和第二层模型stackm组成整体模型结构得到时空数据预测模型。2.如权利要求1所述的基于st...
【专利技术属性】
技术研发人员:贾兴林,
申请(专利权)人:四川佳联众合企业管理咨询有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。