一种船舶运力指标生成及相似系数计算方法及系统技术方案

技术编号:34326498 阅读:14 留言:0更新日期:2022-07-31 01:14
本发明专利技术提供了一种基于船舶运力指标生成及相似系数计算方法及系统,该方法包括航运条件输入探索步骤、指数生成步骤、数据预处理步骤、数据相关性计算步骤和数据展示步骤,通过船舶全生命周期识别、数据库预取算法、面向对象的脚本语言以及相关性计算算法,可以根据多种航运相关条件,生成可用的航运指数,生成的航运指数跟一些经济指数、股票价格之间有很大相关关系,能够用来对市场进行分析、预测或被预测。预测。预测。

【技术实现步骤摘要】
一种船舶运力指标生成及相似系数计算方法及系统


[0001]本专利技术涉及航运信息化、智能化
,具体涉及一种船舶运力指标生成及相似系数计算方法及系统。

技术介绍

[0002]航运与我们的日常生活、社会经济发展息息相关。航运作为全球经济贸易最主要的载体,深刻影响着世界格局,见证世界强国与地区的兴起,影响着世界方方面面的运转,也是我国经济社会发展的重要支柱。航运市场的变化不仅能随着市场的经济状况进行变化,还能影响世界市场的经济变化。
[0003]目前在航运信息领域还没有一款方便快捷的工具用于快速简单的建立指数并分析,本专利技术弥补了市场上的空白,能够简单快捷的对航运信息进行对比和分析,对于航运信息领域的发展以及航运企业分析发展形势,制定决策方案具有重要意义。

技术实现思路

[0004]为解决现有技术并没有方便快捷的工具用于快速简单的建立指数并分析的问题,本专利技术提供一种船舶运力指标生成及相似系数计算方法,该方法通过船舶全生命周期识别、数据库预取算法、面向对象的脚本语言以及相关性计算算法,可以根据多种航运相关条件,生成可用的航运指数,生成的航运指数跟一些经济指数、股票价格之间有很大相关关系,能够用来对市场进行分析、预测或被预测。本专利技术还涉及一种船舶运力指标生成及相似系数计算系统。
[0005]本专利技术的技术方案如下:
[0006]一种船舶运力指标生成及相似系数计算方法,其特征在于,包括以下步骤:
[0007]航运条件输入探索步骤,实时采集船舶运力数据,将采集的船舶运力数据通过大数据实时处理进行船舶全生命周期识别,根据用户的需求输入航运条件后,在船舶全生命周期识别的动态信息中探索满足航运条件的数据,输出探索结果,并将航运条件保存为船舶运力指标;
[0008]指数生成步骤,将探索结果进行统计分析生成当前航运条件下某时间段的航运指数,通过数据库预取算法生成指数唯一标识和指数生成的相关信息,并同步相同时间段的经济指数和/或股票指数;
[0009]数据预处理步骤,通过数据库预取算法分别对航运指数以及相同时间段的经济指数和/或股票指数进行指数平滑处理和指数时间平移处理;
[0010]数据相关性计算步骤,利用面向对象的脚本语言将预处理后的数据两两进行相关性计算,包括计算皮尔森相关性和最大信息系数相关性;
[0011]数据展示步骤,将相关性计算结果大于设定阈值的数据保存下来进行可视化展示。
[0012]优选地,所述航运条件输入探索步骤中,采集的船舶运力数据包括船舶属性数据
和港口属性数据,所述船舶属性数据包括船舶资料、船舶标签、船舶动态、货物种类、船舶AIS、船舶STS、船舶预测全球航线、全球海区、特殊区域、气象信息中的任意组合,所述港口属性数据包括港口资料、港口标签、港口动态、PSC检查、全球海区中的任意组合。
[0013]优选地,所述指数生成步骤中,所述数据库预取算法采用postgreSQL,通过postgreSQL 生成指数唯一标识和指数生成的时间、创建人、条件,将对应生成的指数详细信息保存在另一张指数表中,还同步国内外若干相关经济指数或股票指数。
[0014]优选地,所述数据相关性计算步骤中,利用的面向对象的脚本语言为python,利用python 进行定时计算相关性,除两两进行相关性计算外,还进行一对多的相关性计算以确定两个指数共同对另一个指数的影响程度。
[0015]优选地,所述数据相关性计算步骤进行的是离线计算,对相关性计算结果小于设定阈值的数据不保存,生成计算历史以避免重复计算。
[0016]优选地,所述设定阈值为0.8,将相关性计算结果大于0.8的数据保存下来并使用阿里云 BI工具进行可视化展示,以便查看不同数据间的相关性和指数时间序列图像。
[0017]一种船舶运力指标生成及相似系数计算系统,其特征在于,包括依次连接的航运条件输入探索模块、指数生成模块、数据预处理模块、数据相关性计算模块和数据展示模块,
[0018]航运条件输入探索模块,实时采集船舶运力数据,将采集的船舶运力数据通过大数据实时处理进行船舶全生命周期识别,根据用户的需求输入航运条件后,在船舶全生命周期识别的动态信息中探索满足航运条件的数据,输出探索结果,并将航运条件保存为船舶运力指标;
[0019]指数生成模块,将探索结果进行统计分析生成当前航运条件下某时间段的航运指数,通过数据库预取算法生成指数唯一标识和指数生成的相关信息,并同步相同时间段的经济指数和/或股票指数;
[0020]数据预处理模块,通过数据库预取算法分别对航运指数以及相同时间段的经济指数和/或股票指数进行指数平滑处理和指数时间平移处理;
[0021]数据相关性计算模块,利用面向对象的脚本语言将预处理后的数据两两进行相关性计算,包括计算皮尔森相关性和最大信息系数相关性;
[0022]数据展示模块,将相关性计算结果大于设定阈值的数据保存下来进行可视化展示。
[0023]优选地,所述航运条件输入探索模块中,采集的船舶运力数据包括船舶属性数据和港口属性数据,所述船舶属性数据包括船舶资料、船舶标签、船舶动态、货物种类、船舶AIS、船舶STS、船舶预测全球航线、全球海区、特殊区域、气象信息中的任意组合,所述港口属性数据包括港口资料、港口标签、港口动态、PSC检查、全球海区中的任意组合。
[0024]优选地,所述指数生成模块中,所述数据库预取算法采用postgreSQL,通过postgreSQL 生成指数唯一标识和指数生成的时间、创建人、条件,将对应生成的指数详细信息保存在另一张指数表中,还同步国内外若干相关经济指数或股票指数。
[0025]优选地,所述数据相关性计算模块进行的是离线计算,设定阈值为0.8,对相关性计算结果小于0.8的数据不保存,生成计算历史以避免重复计算;将相关性计算结果大于0.8的数据保存下来并使用阿里云BI工具进行可视化展示,以便查看不同数据间的相关性
和指数时间序列图像。
[0026]本专利技术的有益效果为:
[0027]本专利技术提供的一种基于船舶运力指标生成及相似系数计算方法,将采集的船舶运力数据通过大数据实时处理进行船舶全生命周期识别,在进行航运条件输入以及探索,作为航运指数生成的各种条件,得到满足航运条件的数据,再将探索结果进行统计分析生成当前航运条件下某段时间的航运指数,通过数据库预取算法生成指数唯一标识和指数生成的相关信息,并同步经济指数或股票指数,也就是说,指数生成后,后续再计算航运指数与其它外部指数或股票的相关关系,很多航运信息会反映当前市场或未来市场,也有可能别的市场可以预测航运信息,具体同步、预处理和相关性计算。通过数据库预取算法分别对航运指数以及相同时间段的经济指数和/或股票指数进行指数平滑处理和指数时间平移处理,指数平滑处理可以有效降低突变值带来的影响,指数时间平移处理是将指数日期加减一定的时间,达到时间差的效果,目的是计算相差一定时间后,两组指数的相关性最大,即探索价值更高。在数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种船舶运力指标生成及相似系数计算方法,其特征在于,包括以下步骤:航运条件输入探索步骤,实时采集船舶运力数据,将采集的船舶运力数据通过大数据实时处理进行船舶全生命周期识别,根据用户的需求输入航运条件后,在船舶全生命周期识别的动态信息中探索满足航运条件的数据,输出探索结果,并将航运条件保存为船舶运力指标;指数生成步骤,将探索结果进行统计分析生成当前航运条件下某时间段的航运指数,通过数据库预取算法生成指数唯一标识和指数生成的相关信息,并同步相同时间段的经济指数和/或股票指数;数据预处理步骤,通过数据库预取算法分别对航运指数以及相同时间段的经济指数和/或股票指数进行指数平滑处理和指数时间平移处理;数据相关性计算步骤,利用面向对象的脚本语言将预处理后的数据两两进行相关性计算,包括计算皮尔森相关性和最大信息系数相关性;数据展示步骤,将相关性计算结果大于设定阈值的数据保存下来进行可视化展示。2.根据权利要求1所述的船舶运力指标生成及相似系数计算方法,其特征在于,所述航运条件输入探索步骤中,采集的船舶运力数据包括船舶属性数据和港口属性数据,所述船舶属性数据包括船舶资料、船舶标签、船舶动态、货物种类、船舶AIS、船舶STS、船舶预测全球航线、全球海区、特殊区域、气象信息中的任意组合,所述港口属性数据包括港口资料、港口标签、港口动态、PSC检查、全球海区中的任意组合。3.根据权利要求1或2所述的船舶运力指标生成及相似系数计算方法,其特征在于,所述指数生成步骤中,所述数据库预取算法采用postgreSQL,通过postgreSQL生成指数唯一标识和指数生成的时间、创建人、条件,将对应生成的指数详细信息保存在另一张指数表中,还同步国内外若干相关经济指数或股票指数。4.根据权利要求1或2所述的船舶运力指标生成及相似系数计算方法,其特征在于,所述数据相关性计算步骤中,利用的面向对象的脚本语言为python,利用python进行定时计算相关性,除两两进行相关性计算外,还进行一对多的相关性计算以确定两个指数共同对另一个指数的影响程度。5.根据权利要求4所述的船舶运力指标生成及相似系数计算方法,其特征在于,所述数据相关性计算步骤进行的是离线计算,对相关性计算结果小于设定阈值的数据不保存,生成计算历史以避免重复计算。6.根据权利要求5所述的船舶运力指标生成及相似系数计算方法,其特征在于,所述设定阈值为0.8,将相关性...

【专利技术属性】
技术研发人员:刘鑫鑫
申请(专利权)人:中远海运科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1