一种国际航运集装箱运价预测方法技术

技术编号:28422569 阅读:28 留言:0更新日期:2021-05-11 18:30
本发明专利技术公开了一种国际航运集装箱运价预测方法,包括以下步骤:获取,预处理出口集装箱历史运价数据;对历史数据进行技术面处理,分析历史价格时间序列,环期,同期价格数据特点,挖掘观测日期与出发日期远近,目的港,出口淡旺季等因素对票价影响情况;根据历史数据与上述影响因子对未来时间段的价格进行预测。本发明专利技术所述的一种国际航运集装箱运价预测方法,在根据历史价格进行预测的基础上,客观考虑了价格波动存在的周期性,市场热度,当前日期距离出发日期远近等多种因素,提高了预测精度,能够有效降低企业出口货运成本、降低行业违约率、提高国际海运运输组织的执行效率。

【技术实现步骤摘要】
一种国际航运集装箱运价预测方法
本专利技术涉及航运价格预测
,特别涉及一种国际航运集装箱运价预测方法。
技术介绍
自2008年金融危机以来,中国对世界经济增长的贡献率一直保持在30%左右,早在2010年中国就成为世界第二大经济体,2013年成为世界第一大货物贸易国,2017年我国进出口贸易总额为27.79万亿元。国际航运服务于国际贸易,而国际贸易中90%的物流由国际海运来完成。20世纪70年代开始流行的集装箱技术让洲际运输成本进一步大幅度降低,为全球贸易提供了更加便利的条件,近年来国际集装箱航运市场运价波动剧烈,不可预见性增强,而国际集装箱海运业是一个需要巨大投入的资本密集型行业,运价的剧烈波动给航运企业,贸易商以及行业整体带来了巨大的风险,运价波动趋势研究和运价预测一直是国际集装箱航运业关注的热点,国际集装箱海运运价预测的研究在提高行业成本管理水平、降低行业违约率、提高国际海运运输组织的执行效率以及政府决策量化参考等方面有着积极的作用。由于船公司定价策略大多依赖于供需关系以及竞争博弈情况来制定价格。船运公司商业机密不公开,缺少相关公司定价策略,剩余仓位信息,无法获取决定票价的直接影响因素使得价格预测成为了一个很具挑战性的问题。目前价格预测的研究主要分为两个方向,一个方向是针对价格涨跌趋势的二元分类预测,另一个放心则是针对具体航次价格数值的回归预测,后者能为出口企业提供更好更直观的决策支持。现有技术中,针对价格数值的回归预测主要有两类方法,一类是基于价格序列自身历史值得时间序列方法,第二类是针对价格影响因素建立模型的回归方法。但价格波动属于非平稳模式,不仅因为季节等时间因素对价格的影响,也因为船运公司的定价策略本身也在不停地调整。这会使得通过拟合历史数据的预测模型会在新数据上失效,需要不断地重新训练模型,并需要考虑历史价格数据的时效性,故此,我们提出了一种国际航运集装箱运价预测方法。
技术实现思路
本专利技术的主要目的在于提供一种国际航运集装箱运价预测方法,可以有效解决
技术介绍
中的问题。为实现上述目的,本专利技术采取的技术方案为:一种国际航运集装箱运价预测方法,包括以下步骤:S1、获取历史集装箱价格数据,并在时间维度,航线维度和价格维度多个维度对价格历史数据进行分类,得到同一数据在不同维度下的分类结果;S2、对分类后的历史价格进行技术面预处理,包括以下步骤:步骤一、数据去噪:对含有随机噪声的原始价格数据进行小波去噪,去掉数据中的随机波动;步骤二、价格时间序列平稳化:通过一阶差分可以将非平稳随机游走其转化为平稳的白噪声;数据补齐:步骤三、对历史数据的缺失进行补齐,将缺失数据分类成非系统性缺失和系统性缺失;对非系统性缺失数据,采用前后数据的均值补齐;对系统化缺失分类成结构性缺失和非结构性缺失;对结构性缺失采用三阶滑动平均法进行填补,对非结构性缺失,采用随机森林预测的方法进行补齐;步骤四、归一化处理:从时间维度,航程维度,航线维度,价格维度分别对价格数据进行归一化处理;步骤五、有监督学习数据集生成:分析所述多维度价格的数据规律与关系,对集装箱价格预测问题进行描述和定义得到时间序列-特征-价格数据。S3、挖掘价格序列与外在影响因子的数据规律与关系,得到特征-价格序列数据,具体为:因果关系判定:使用格兰杰因果关系分析法,测试一个序列对于价格时间序列是否具有预测信息;使用Pearson相关系数作为不同维度特征关联程度的指标,通过关联程度加权计算得到加权指数;其pearson系数计算公式为:其中,cov(X,Y)是随机变量X,Y的协方差,cov(X,Y)分别为X,Y的标准差,ρX,Y取值范围[0,1],ρX,Y越大表示X,Y相关性越强。ρX,Y=1时,表示X,Y成正相关,ρX,Y=0时,代表X,Y无线性关系;S4、根据历史价格序列数据与上述影响因子对未来时间段的价格进行回归预测。优选的,所述S1中时间维度分类具体为:同一天出航的集装箱价格在不同的观测日期的价格,不同出发日期在同一个观测日期的价格,所述航线维度具体为:起始港,目的港,沿途上卸货港,航程,是否经过运河,是否船公司主力航线,开船频次,月开船数量,价格维度具体为:历史提价,降价次数,价格序列的平均值、标准差、最小值和最大值,价格波动平均间隔时间,波动平均次数。优选的,所述S2中步骤五的价格时间序列平稳化具体为:将时间序列经过d次差分处理后,用移动平均模型来拟合平稳检验。求得序列的自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层p和阶数q。优选的,所述S2中步骤五集装箱价格时间序列与时间的先后顺序强烈相关,利用LSTM处理时序数据的优势,构建多变量时间序列预测模型,分别对多种因素进行综合考虑,在输入数据类型的层面,将与价格相关的外在影响因子作为输入特征来进行时序预测,进行特征连接融合,得到最终训练模型。优选的,所述S2中步骤五在国际集装箱航运数据中,不同的特征属性的量纲不同,特征属性值的取值范围不一,需要对各特征属性值做归一化处理,以规避量纲不同对预测模型的影响;价格序列数据包括:根据连续多天出发日期对应的价格序列,与同一天出航日期多个观测日期的价格序列,历史提价,降价次数,价格序列的平均值、标准差、最小值和最大值,价格波动平均间隔时间,波动平均次数。优选的,所述S2中步骤五对所有的外部特征,利用BatchNormalization层做数据的标准化,然后通过两个全连接神经网络层将数据映射为一个n维特征向量。优选的,所述S4中根据历史价格序列数据与上述影响因子对未来时间段的价格进行预测外部特征部分包括3个操作步骤,分别为:数据标准化以及两个全连接层,包括:利用与集装箱价格相关的多方面的有价值因素,向LSTM模型中加入外部特征,其中,有价值因素包括的信息属性类别有:航线属性、航程属性、时间属性.优选的,所述航线属性类别中包括的特征向量有:是否主力航线,开船频次,月开船数量;所述航程属性信息属性类别中包括的特征向量有:起始港,目的港,所在国家信息,航程天数,沿途上卸货港口,是否经过运河;所述时间属性信息属性类别中包括的特征向量有:出发时间段、到达时间段、观测日期与出发日期间隔时间.优选的,所述S4中时间序列特征提取、外部特征提取、特征融合,其中:所述时间序列特征提取部分包括:数据标准化,设置一个滑动窗口为k个连续工作日。每一个训练样本由k个连续的工作日组成;将输入数据转化为LSTM数据格式,按照固定比例拆分为训练集和测试集;所述外部特征部分包括3个操作步骤,分别为:数据标准化以及两个全连接层;所述特征连接融合部分包括4个操作步骤,分别为:数据标准化以及三个全连接层,将数据映射到最终所要预测的维数,并将所要预测的数据按顺序排列成向量作为监督学习中的因变量向量,即获得对未来的集装箱价格的最终训练模型。优选的,所述S4中计算前一天的预测票价值与实际票价值的差值;如果所本文档来自技高网
...

【技术保护点】
1.一种国际航运集装箱运价预测方法,其特征在于:包括以下步骤:/nS1、获取历史集装箱价格数据,并在时间维度,航线维度和价格维度多个维度对价格历史数据进行分类,得到同一数据在不同维度下的分类结果;/nS2、对分类后的历史价格进行技术面预处理,包括以下步骤:/n步骤一、数据去噪:对含有随机噪声的原始价格数据进行小波去噪,去掉数据中的随机波动;/n步骤二、价格时间序列平稳化:通过一阶差分可以将非平稳随机游走其转化为平稳的白噪声,数据补齐;/n步骤三、对历史数据的缺失进行补齐,将缺失数据分类成非系统性缺失和系统性缺失;对非系统性缺失数据,采用前后数据的均值补齐;对系统化缺失分类成结构性缺失和非结构性缺失;对结构性缺失采用三阶滑动平均法进行填补,对非结构性缺失,采用随机森林预测的方法进行补齐;/n步骤四、归一化处理:从时间维度,航程维度,航线维度,价格维度分别对价格数据进行归一化处理;/n步骤五、有监督学习数据集生成:分析所述多维度价格的数据规律与关系,对集装箱价格预测问题进行描述和定义得到时间序列-特征-价格数据;/nS3、挖掘价格序列与外在影响因子的数据规律与关系,得到特征-价格序列数据,具体为:/n因果关系判定:使用格兰杰因果关系分析法,测试一个序列对于价格时间序列是否具有预测信息;使用Pearson相关系数作为不同维度特征关联程度的指标,通过关联程度加权计算得到加权指数;其pearson系数计算公式为:/n...

【技术特征摘要】
1.一种国际航运集装箱运价预测方法,其特征在于:包括以下步骤:
S1、获取历史集装箱价格数据,并在时间维度,航线维度和价格维度多个维度对价格历史数据进行分类,得到同一数据在不同维度下的分类结果;
S2、对分类后的历史价格进行技术面预处理,包括以下步骤:
步骤一、数据去噪:对含有随机噪声的原始价格数据进行小波去噪,去掉数据中的随机波动;
步骤二、价格时间序列平稳化:通过一阶差分可以将非平稳随机游走其转化为平稳的白噪声,数据补齐;
步骤三、对历史数据的缺失进行补齐,将缺失数据分类成非系统性缺失和系统性缺失;对非系统性缺失数据,采用前后数据的均值补齐;对系统化缺失分类成结构性缺失和非结构性缺失;对结构性缺失采用三阶滑动平均法进行填补,对非结构性缺失,采用随机森林预测的方法进行补齐;
步骤四、归一化处理:从时间维度,航程维度,航线维度,价格维度分别对价格数据进行归一化处理;
步骤五、有监督学习数据集生成:分析所述多维度价格的数据规律与关系,对集装箱价格预测问题进行描述和定义得到时间序列-特征-价格数据;
S3、挖掘价格序列与外在影响因子的数据规律与关系,得到特征-价格序列数据,具体为:
因果关系判定:使用格兰杰因果关系分析法,测试一个序列对于价格时间序列是否具有预测信息;使用Pearson相关系数作为不同维度特征关联程度的指标,通过关联程度加权计算得到加权指数;其pearson系数计算公式为:



其中,是随机变量X,Y的协方差,分别为X,Y的标准差,取值范围[0,1],越大表示X,Y相关性越强;

=1时,表示X,Y成正相关,=0时,代表X,Y无线性关系;
S4、根据历史价格序列数据与上述影响因子对未来时间段的价格进行回归预测。


2.根据权利要求1所述的一种国际航运集装箱运价预测方法,其特征在于:所述S1中时间维度分类具体为:同一天出航的集装箱价格在不同的观测日期的价格,不同出发日期在同一个观测日期的价格,所述航线维度具体为:起始港,目的港,沿途上卸货港,航程,是否经过运河,是否船公司主力航线,开船频次,月开船数量,价格维度具体为:历史提价,降价次数,价格序列的平均值、标准差、最小值和最大值,价格波动平均间隔时间,波动平均次数。


3.根据权利要求1所述的一种国际航运集装箱运价预测方法,其特征在于:所述S2中步骤五的价格时间序列平稳化具体为:将时间序列经过d次差分处理后,用移动平均模型来拟合平稳检验;
求得序列的自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层p和阶数q。


4.根据权利要求1所述的一种国际航运集装箱运价预测方法,其特征在于:所述S2中步骤五集装箱价格时间序列与时间的先后顺序强烈相关,利用LSTM处理时序数据的优势,构建多变量时间序列预测模型,分别对多种因素进行综合考虑,...

【专利技术属性】
技术研发人员:郭彦儒方结
申请(专利权)人:上海汇航捷讯网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1