当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于实际航运业务和数据挖掘的运力预测方法技术

技术编号:24011697 阅读:72 留言:0更新日期:2020-05-02 01:57
本发明专利技术公开了一种基于实际航运业务和数据挖掘的运力预测方法,首先从实际航运行业数据中提取出船舶实验数据,并基于时间一致性检测以及预设船舶航行规律过滤和清除船舶实验数据中包含的异常数据,接着将邻近航次合并为一条有效船舶历史航次;接下来对基础数据和处理后的航线数据进行特征选择,获得有效实验数据集;然后根据航线和船型,计算有效实验数据集中不同船型和航线的航次周转期,根据船舶标识,计算有效实验数据集中不同船舶的船舶周转期;最后根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,对可用运力进行预测。本发明专利技术可以得到高质量的实验数据,并实时预测航次时长,进而预测市场可用运力。

A method of capacity prediction based on actual shipping business and data mining

【技术实现步骤摘要】
一种基于实际航运业务和数据挖掘的运力预测方法
本专利技术涉及数据挖掘
,具体涉及一种基于实际航运业务和数据挖掘的运力预测方法。
技术介绍
大数据具有数据体量大、类型多、处理速度快、数据真实性强和价值密度低等特点。对大数据进行分析,挖掘大数据所蕴涵的价值,应用前景广阔。目前大数据技术已经融入各行各业,在评价、预测方面发挥了重要作用。大数据能帮助政府实现市场经济调控、公共卫生安全防范、灾难预警、社会舆论监督;可以帮助航空公司节省运营成本;帮助企业提升营销的针对性,降低物流和库存的成本等。船舶行业是个传统的行业,与互联网和大数据技术结合相对滞后一些。但船舶行业绝对是一个全球性且规模庞大的行业,联系着设计、制造和货物运输,联系着贸易市场和人们的生活,数据来源广泛,蕴涵着许多潜在价值的知识与信息,需要去挖掘和发现。因此多个大数据在船舶行业的应用都在启动。欧洲已经发表了“MUNIN(MaritimeUnmannedNavigationthoughIntelligenceNetwork)”项目,旨在发展新一代控制系统与通信技术,显示并控制在港和离港的船舶,这无疑推动了信息化船舶与信息化航运的发展。2014年7月,日本船舶技术研究协会着手船舶“大数据路标”工作,通过搜集多艘船舶的航行及其相关数据形成大数据,计划为船舶的节能航行、船型开发、装备远程维护等项目所使用。何山和马云涌提出了未来航运信息化的发展的趋势,论述了航运业对大数据技术的迫切需求,同时也为船舶行业大数据应用提供了启示。此外,在航运业的低谷期,人们也在积极探索大数据时代给航运业的转型发展所带来的积极影响。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:通过收集和对营运船舶监测获取的数据进行统计分析以及价值挖掘,可以获得很多有价值的数据信息。然而根据考察当前中国沿海航运的实际情况,目前虽然已有一些公司提供实时查询船舶动态,能够为船东、货主、船舶代理、货运代理、船员及其家属,提供船舶实时动态,能给船舶安全航行管理、港口调度计划、物流带来一定的遍历,但是由于无法全面且准确获取可用运力数据,从而无法对运力进行有效预测,目前只能从各个消息网片面的获取市场上可用运力的信息进行船货供需预估。由此可知,现有技术中存在运力预测中实验数据质量低以及预测效果不佳的技术问题。
技术实现思路
有鉴于此,本专利技术提供了一种基于实际航运业务和数据挖掘的运力预测方法,用以解决或者至少部分解决现有技术中存在的运力预测中实验数据质量低以及预测效果不佳的技术问题。为了解决上述技术问题,本专利技术提供了一种基于实际航运业务和数据挖掘的运力预测方法,包括:步骤S1:从实际航运行业数据中提取出船舶实验数据,并基于时间一致性检测以及预设船舶航行规律过滤和清除船舶实验数据中包含的异常数据,获得处理后的船舶实验数据,其中,处理后的船舶实验数据包括基础数据和历史航线数据,基础数据包括船型、船舶标识,历史航线数据包括航次;步骤S2:根据航线数据中航线的时间连续性和预设规则,将邻近航次合并为一条有效船舶历史航次,获得处理后的航线数据;步骤S3:对基础数据和处理后的航线数据进行特征选择,获得有效实验数据集;步骤S4:根据航线和船型,计算有效实验数据集中不同船型和航线的航次周转期,根据船舶标识,计算有效实验数据集中不同船舶的船舶周转期;步骤S5:根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,对可用运力进行预测。在一种实施方式中,基础数据包括船舶基础属性数据和港口基础属性数据,港口基础属性数据包括港口名,步骤S1具体包括:将基础数据中包含的不规则港口名与收集的规则港口数据集进行相似性映射、通过船舶航次的可溯源性,基于邻近时间填充航次的缺失值,根据唯一性规则、连续型规则和空值规则清除不一致数据。在一种实施方式中,步骤S2具体包括:步骤S2.1:将历史航线数据按照船舶标识进行分组,并根据时间进行升序排列;步骤S2.2:根据航线的起始港,终点港,航次时间是否与相邻航次的数值具备一致性,以及停泊时长的合理性,对航线数据的有效性进行判断;步骤S2.3:如果当前航次有效,则判断相邻航次的装卸货时长是否在给定阈值内,如果在,则将当前航次与相邻航次进行合并,重复执行步骤S2.2~S2.3,直到所有船舶的航线数据处理完毕。在一种实施方式中,基础数据和处理后的航线数据中包括连续型数据、文本属性数据以及与决策航次时间的数据,步骤S3具体包括:对连续型数据进行离散化处理、对文本属性数据进行属性数值规约、对决策航次时间的数据进行泛化,获得有效实验数据集。在一种实施方式中,连续型数据包括船型,对连续型数据进行离散化处理,包括:按区间进行数据监督离散化操作,根据航运通用分组方式进行分类并离散化。在一种实施方式中,文本属性数据包括装货港和卸货港,对文本属性数据进行属性数值规约包括:建立装货港与卸货港组合的映射关系,规约为有效航线数据,当装货港或者卸货港缺失时,采用标准装货港和标准卸货港进行填充。在一种实施方式中,步骤S5具体包括:根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,设置两种运力计算方式,其中,第一种运力计算方式为根据设定的时间段计算筛选出可用船舶,第二种运力计算方式为选定某一船舶,计算未来可用船期;根据设置的运力计算方式,对运力进行预测。在一种实施方式中,根据设置的运力预测方式,对运力进行预测,包括:筛选出“当前时间+从当前位置到达装货港所需天数+当前时间至指定未来时间的航次数*周转期=指定未来时间”并且“船型=指定船型±10%”的所有船舶,作为可用船舶,其中,当前航次卸货港缺失,则周转期取船舶周转期,否则取航次周转期;计算出“指定的船舶从当前位置到达下一个装货港所需天数+未来航次数*船舶周转期<=k”的航次数n,并列出当前时间+从当前位置到达下一个装货港所需天数+{0,1,…,n}*周转期所对应的日期序列,作为未来可用船期,其中,k为指定的未来天数,当前航次卸货港缺失,则周转期取船舶周转期,否则取航次周转期。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本专利技术提供的一种基于实际航运业务和数据挖掘的运力预测方法,首先对从实际航运行业数据中提取出的船舶实验数据进行过滤,可以过滤和清除异常数据,从而得到处理后的船舶实验数据,接着根据航线数据中航线的时间连续性和预设规则,将邻近航次进行合并,可以将多条邻近航线按指定规则规范化为一条有效船舶历史航次,接下来,对基础数据和处理后的航线数据进行特征选择,获得有效实验数据集,即得到高质量的实验数据,然后从两个维度计算船舶运力的周转期,最后,根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,对可用运力进行预测,本专利技术可以将船舶隐式数据转换为实际业务中可用的显式数据,一方面可以得本文档来自技高网
...

【技术保护点】
1.一种基于实际航运业务和数据挖掘的运力预测方法,其特征在于,包括:/n步骤S1:从实际航运行业数据中提取出船舶实验数据,并基于时间一致性检测以及预设船舶航行规律过滤和清除船舶实验数据中包含的异常数据,获得处理后的船舶实验数据,其中,处理后的船舶实验数据包括基础数据和历史航线数据,基础数据包括船型、船舶标识,历史航线数据包括航次;/n步骤S2:根据航线数据中航线的时间连续性和预设规则,将邻近航次合并为一条有效船舶历史航次,获得处理后的航线数据;/n步骤S3:对基础数据和处理后的航线数据进行特征选择,获得有效实验数据集;/n步骤S4:根据航线和船型,计算有效实验数据集中不同船型和航线的航次周转期,根据船舶标识,计算有效实验数据集中不同船舶的船舶周转期;/n步骤S5:根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,对可用运力进行预测。/n

【技术特征摘要】
1.一种基于实际航运业务和数据挖掘的运力预测方法,其特征在于,包括:
步骤S1:从实际航运行业数据中提取出船舶实验数据,并基于时间一致性检测以及预设船舶航行规律过滤和清除船舶实验数据中包含的异常数据,获得处理后的船舶实验数据,其中,处理后的船舶实验数据包括基础数据和历史航线数据,基础数据包括船型、船舶标识,历史航线数据包括航次;
步骤S2:根据航线数据中航线的时间连续性和预设规则,将邻近航次合并为一条有效船舶历史航次,获得处理后的航线数据;
步骤S3:对基础数据和处理后的航线数据进行特征选择,获得有效实验数据集;
步骤S4:根据航线和船型,计算有效实验数据集中不同船型和航线的航次周转期,根据船舶标识,计算有效实验数据集中不同船舶的船舶周转期;
步骤S5:根据有效实验数据集、不同船型和航线的航次周转期以及不同船舶的船舶周转期,对可用运力进行预测。


2.如权利要求1所述的方法,其特征在于,基础数据包括船舶基础属性数据和港口基础属性数据,港口基础属性数据包括港口名,步骤S1具体包括:
将基础数据中包含的不规则港口名与收集的规则港口数据集进行相似性映射、通过船舶航次的可溯源性,基于邻近时间填充航次的缺失值,根据唯一性规则、连续型规则和空值规则清除不一致数据。


3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:
步骤S2.1:将历史航线数据按照船舶标识进行分组,并根据时间进行升序排列;
步骤S2.2:根据航线的起始港,终点港,航次时间是否与相邻航次的数值具备一致性,以及停泊时长的合理性,对航线数据的有效性进行判断;
步骤S2.3:如果当前航次有效,则判断相邻航次的装卸货时长是否在给定阈值内,如果在,则将当前航次与相邻航次进行合并,重复执行步骤S2.2~S2.3,直到所有船舶的航线数据处理完毕。


4.如权利要求1所述的方法,...

【专利技术属性】
技术研发人员:黄传河卢桃陈瀚榕谢雯馨王珊珊王亚飞陈秋秋
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1