当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于时空关联的港口货运量在线预测方法及系统技术方案

技术编号:29874476 阅读:14 留言:0更新日期:2021-08-31 23:49
本发明专利技术还公开了一种基于时空关联的港口短期货运量在线预测方法,包含如下步骤:首先获取目标港口和其他港口的过去预设时间段内的货运量数据,并对数据进行均值处理;接着目标港口和其他港口的货运量数据进行灰度关联分析,计算各港口关联度,选取相关度高于关联度阈值的其他港口划分数据并构建货运量时空预测模型;然后将划分好的训练数据输入模型中进行模型训练,训练后的模型用于预测目标港口的短期货运量。所述方法考虑相关港口的时空相关性,可以提高短期货运量预测的准确性,同时采用的GBDT在预测模型中具有最高的预测精度。

【技术实现步骤摘要】
一种基于时空关联的港口货运量在线预测方法及系统
本专利技术涉及港口货运量预测领域,具体涉及一种基于时空关联的港口货运量在线预测方法及系统。
技术介绍
港口货运量是指一定时期内港口实际运输的吨位,它是到达量和交付量的总和,是揭示港口经济状况以及港口地区经济活力的重要指标。货运量的预测可以根据不同的标准进行分类。按运输范围可分为全国货运需求预测,全国货运需求预测和各部门货运需求。关于预测内容,可以分为交货预测,到达预测和货运量预测。关于预测时间的长短,可以分为长期预测,中期预测和短期预测。但是,长期预测和短期预测之间没有明显的区别。通常,短期预测主要集中于每小时、每天、每周的货运量预测,可用于港口管理以管理人力资源和物质资源。相比之下,长期预测主要集中在年度货运量的预测上,可用于分析港口的长期目标以及港口基础设施的建设和规划。由于这两种预测的影响因素不同,并且它们的数据源也不同,因此预测方法也有所不同。港口货运量的预测方法主要分为两类:一类是考虑港口货运量影响因素的预测模型,另一种是基于港口本身过去预设时间段内数据的时间序列预测。后者货运量预测方法可进一步分为基于移动平均的自回归模型和基于机器学习的方法。经过对多元线性回归模型、季节自回归移动平均模型(seasonalautoregressiveintegratedmovingaverage,SARIMA)、人工神经网络(artificialneuralnetwork,ANN)和支持向量机(supportvectormachine,SVM)模型在货运量时间序列预测中的有效性进行对比研究,发现以SVM和ANN表现最优,即机器学习的方法优于基于移动平均的方法。然而,目前预测方法中存在的不足,体现在两个方面:一是机器学习预测中没有充分考虑增强学习算法的预测方法;二是当前的方法主要还是依据时间序列的预测模型,没有考虑港口货运量空间上的关联性。基于此,本专利技术提出了一种基于时空关联的港口货运量在线预测方法及系统。
技术实现思路
专利技术目的:考虑港口货运量是空间关联特征,通过线上采集多个港口的过去预设时间段内的货运量数据,采用增强学习的方法来构建港口货运量预测模型,从而在提高港口货运量预测的准确性的基础上,实现对目标港口的下一阶段货运量的在线预测。技术方案:为了实现上述目的,本专利技术采用如下技术方案:一种基于时空关联的港口货运量在线预测方法,该方法包括以下步骤:步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn],过去预设时间段内的货运量数据其中n为港口标识总数Pn表示第n个港口,i=1,2,3,...,n,表示第i个港口在k阶段的货运量,k=1,2,3,...,t,t表示获取货运量数据的时间段,目标港口P0的货运量数据用表示,其中表示目标港口在k阶段的货运量,k=1,2,3,...,t,首次选择其他港口可根据其他港口距离目标港口的距离以及其他港口的等级进行选择,之后在完成一次关联分析和预测结果分析之后,可根据关联分析和预测结果分析进行差异选取;步骤2,根据目标港口和其他港口过去预设时间段内的货运量数据,对目标港口和其他港口的货运量数据进行灰度关联分析,计算出各港口与目标港口的关联度,并设置关联度阈值δ,选取相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],其中l≤n,表示从n个港口中筛选出的用于预测的l个港口,并结合目标港口自身货运量数据用于构建货运量时空预测模型;步骤3,划分其他港口P′=[P1′,P2′,…,Pl′]和目标港口P0的数据,得到的训练样本用于训练模型;步骤4,以GBDT模型构建货运量时空预测模型,并通过实验确定模型参数;步骤5,训练模型,将划分好的训练数据输入模型中进行模型训练,完成相关港口与目标港口之间货运量关系的映射;步骤6,以选取的其他港口P'和目标港口P0过去预设时间段内的货运量数据为输入数据,输入训练完成的预测模型中,得到目标港口P0下一阶段的货运量预测值。进一步的:所述步骤2中,灰度关联分析包括以下五个步骤:步骤2.1,确定反映系统行为的参考序列和影响系统行为的比较序列,港口货运量预测中,目标港口货运量时间序列数据是参考序列,要分析的其他港口货运量时间序列数据是比较序列;步骤2.2,对于维度不同的各类系统数据,执行数据无量纲处理,即采用均值化方法处理所有货运量数据;步骤2.3,计算相关系数,假设Δi(t)=|y(t)-xi(t)|,其中,t表示时间,i表示港口序列,则根据公式(1)计算港口Pi和目标港口P0相关系数:式中,ρ是分辨率系数,ρ越小则分辨率越强,ρ被设定为0.5;步骤2.4,根据计算出的港口相关度,对港口进行相关性排序。进一步的:所述步骤2.4中,在计算出目标港口P0与其他港口P=[P1,P2,…,Pn]之间的相关度之后,设置相关联度阈值δ以选择关联度高于阈值的港口P′=[P1′,P2′,…,Pl′]。关联度阈值可通过各个港口与目标港口的关联度分析结果获得,通过改变δ分析最后预测结果的变换情况来确定,δ=0.85。进一步的,所述步骤3中,对筛选过后的关联港口P′=[P′1,P′2,…,P′l]和目标港口P′=[P′1,P′2,…,P′l]的过去预设时间段内货运量数据进行划分,确定模型时间维度并据此将训练数据划分得到W个样本数据(xj,yj),j=1,2,...,W,其中,T表示中的数据长度,floor表示向下取整函数,(xj,yj)中xj表示训练样本的输入数据,yj表示训练样本的输出数据,其中,表示第j个样本中第z个用于预测的港口P'时间维度内第阶段的货运量数据,表示第j个样本中第z个用于预测的港口P'时间维度内第阶段的货运量数据,z=1,2,3...,l,l表示从n个港口中筛选出的用于预测的l个港口;表示第j个样本中目标港口P0时间维度内第阶段的货运量数据,表示第j个样本中目标港口P0时间维度内第阶段的货运量数据。进一步的:所述步骤4中,具体地,假设货运量时空预测预测模型以函数F(x,P)表示,其中x表示模型输入数据,包含了模型输入的时空维度,P表示P′=[P1′,P2′,…,Pl′]和目标港口P0的集合,用于表征输入到预测模型的港口,则目标港口P0的货运量y'预测函数可表示为:其中,表示模型预测所确定的时间维度,表示第z个用于预测的港口P'过去时间内第个阶段的货运量,表示第z个用于预测的港口P'过去时间内第t个阶段的货运量,表示目标港口P0过去时间第个阶段的货运量,表示目标港口P0过去时间第t个阶段的货运量。进一步的:所述步骤5中,选择相关度不小于关联度阈值的关联港口过去预设时间段内的货运量训练样本为输入,目标港口货运量训练样本为预期输出进行GBDT预测模型训练,首先以公式(3)初始化弱学习器:其中,L表示损失函数,yj即为训练数据中目标港口货运量的值,γ表示拟合值,可通过对所有yj取均值的方式计算,作为初始学习本文档来自技高网
...

【技术保护点】
1.一种基于时空关联的港口货运量在线预测方法,其特征在于:该方法包括以下步骤:/n步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P

【技术特征摘要】
1.一种基于时空关联的港口货运量在线预测方法,其特征在于:该方法包括以下步骤:
步骤1,货运量数据准备,用于港口货运量时空关联分析及货运量预测的多个港口P=[P1,P2,…,Pn],过去预设时间段内的货运量数据其中n为港口标识总数Pn表示第n个港口,i=1,2,3,...,n,表示第i个港口在k阶段的货运量,k=1,2,3,...,t,t表示获取货运量数据的时间段,目标港口P0的货运量数据用表示,其中表示目标港口在k阶段的货运量,k=1,2,3,...,t,首次选择其他港口可根据其他港口距离目标港口的距离以及其他港口的等级进行选择,之后在完成一次关联分析和预测结果分析之后,可根据关联分析和预测结果分析进行差异选取;
步骤2,根据目标港口和其他港口过去预设时间段内的货运量数据,对目标港口和其他港口的货运量数据进行灰度关联分析,计算出各港口与目标港口的关联度,并设置关联度阈值δ,选取相关度高于关联度阈值的其他港口P′=[P1′,P2′,…,Pl′],其中l≤n,表示从n个港口中筛选出的用于预测的l个港口,并结合目标港口自身货运量数据用于构建货运量时空预测模型;
步骤3,划分其他港口P′=[P1′,P2′,…,Pl′]和目标港口P0的数据,得到的训练样本用于训练模型;
步骤4,以GBDT模型构建货运量时空预测模型,并通过实验确定模型参数;
步骤5,训练模型,将划分好的训练数据输入模型中进行模型训练,完成相关港口与目标港口之间货运量关系的映射;
步骤6,以选取的其他港口P'和目标港口P0过去预设时间段内的货运量数据为输入数据,输入训练完成的预测模型中,得到目标港口P0下一阶段的货运量预测值。


2.根据权利要求1所述的基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤2中,灰度关联分析包括以下五个步骤:
步骤2.1,确定反映系统行为的参考序列和影响系统行为的比较序列,港口货运量预测中,目标港口货运量时间序列数据是参考序列,要分析的其他港口货运量时间序列数据是比较序列;
步骤2.2,对于维度不同的各类系统数据,执行数据无量纲处理,即采用均值化方法处理所有货运量数据;
步骤2.3,计算相关系数,假设Δi(t)=|y(t)-xi(t)|,其中,t表示时间,i表示港口序列,则根据公式(1)计算港口Pi和目标港口P0相关系数:



式中,ρ是分辨率系数,ρ越小则分辨率越强,ρ被设定为0.5;
步骤2.4,根据计算出的港口相关度,对港口进行相关性排序。


3.根据权利要求2所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于:所述步骤2.4中,在计算出目标港口P0与其他港口P=[P1,P2,…,Pn]之间的相关度之后,设置相关联度阈值δ以选择关联度高于阈值的港口P′=[P1′,P2′,…,Pl′]。关联度阈值可通过各个港口与目标港口的关联度分析结果获得,通过改变δ分析最后预测结果的变换情况来确定,δ=0.85。


4.根据权利要求3所述的一种基于时空关联的港口短期货运量在线预测方法,其特征在于,所述步骤3中,对筛选过后的关联港口P′=[P1′,P2′,…,Pl′]和目标港口P′=[P1′,P2′,…,Pl′]的过去预设时间段内货运量数据进行划分,确定模型时间维度并据此将训练数据划分得到W个样本数据(xj,yj),j=1,2,...,W,其中,T表示中的数据长度,floor表示向下取整函数,(xj,yj)中xj表示训练样本的输入数据,yj表示训练样本的输出数据,其中,表示第j个样本中第z个用于预测的港口P'时间维度内第阶段的货运量数据,表示第j个样本中第z个用于预测的港口P'时间维度内第阶段的货运量数据,z=1,2,3...,l,l表示从n个港口中筛选出的用于预测的l个港口;表示第j个样本中目标港口P0...

【专利技术属性】
技术研发人员:鲍香台苏竹勋刘磊
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1