一种基于K-means和Apriori的算法海事大数据关联分析的方法技术

技术编号:24708187 阅读:68 留言:0更新日期:2020-06-30 23:59
本发明专利技术公开了一种基于K‑means和Apriori的算法海事大数据关联分析的方法,首先根据不同业务采用k‑means聚类算法进行聚类,将数据集划分出了多个互不相交的“簇”,再在各“簇”内通过Apriori算法实现各类事件关联规则挖掘,其结果表明使用该方法经过聚类后的同一簇内事件关联程度明显优于直接在数据集中使用Apriori算法进行挖掘,为海事大数据关联分析提供重要依据,构建海事知识图谱。

【技术实现步骤摘要】
一种基于K-means和Apriori的算法海事大数据关联分析的方法
本专利技术涉及数据处理
,具体为一种基于K-means和Apriori的算法海事大数据关联分析的方法。
技术介绍
当前海事的决策分析更多的是基于大量数据报表形成统计型分析,需要人工的介入分析统计数据背后的意义,进而发现事情和问题的原因。这种数据分析更多的还是基于“因果”的思维,但在未来智慧海事发展中会面临以下瓶颈:1.无法分析出问题的原因,进而无法解决问题;2.造成问题的原因很多,导致无法有效的解决问题;3.数据统计不客观、不全面、虚假数据等因素,造成“数据说谎”的情况;4.数据因果分析效率较低,难以实现实时的决策。根据国家海事部门编制的《海事信息系统顶层设计》及智慧海事战略规划要求,海事信息化发展取得了可观的成果,海事云数据中心建设取得突破性进展,基本实现了全国海事系统基础数据的汇集与筛选,为海事大数据应用夯实了基础。未来,基于数据的“事实”将会成为决策的重要依据。
技术实现思路
本专利技术的本文档来自技高网...

【技术保护点】
1.一种基于K-means和Apriori的算法海事大数据关联分析的方法,其特征在于:包括以下步骤:/nA、建立海事数据资源库,提取并形成海事基础信息属性:海事业务大多围绕人、船、环境等要素,根据海事业务的特点,建立标准的海事数据资源库,并从业务属性方面进行分析,以便全面挖掘数据特征;/nB、进行属性归类,实现利用k-means聚类算法实现聚类:根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇;根据k值的设定,将数据按属性距离分为若干不相交的簇;同一个“簇”内的数据对象具有一定的相似程度,而不同“簇”间的数据对象相似程度使之降低;/nC、利用A...

【技术特征摘要】
20191204 CN 20191122670351.一种基于K-means和Apriori的算法海事大数据关联分析的方法,其特征在于:包括以下步骤:
A、建立海事数据资源库,提取并形成海事基础信息属性:海事业务大多围绕人、船、环境等要素,根据海事业务的特点,建立标准的海事数据资源库,并从业务属性方面进行分析,以便全面挖掘数据特征;
B、进行属性归类,实现利用k-means聚类算法实现聚类:根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇;根据k值的设定,将数据按属性距离分为若干不相交的簇;同一个“簇”内的数据对象具有一定的相似程度,而不同“簇”间的数据对象相似程度使之降低;
C、利用Apriori算法实现海事数据关联分析;
D、建立海事知识图谱。


2.根据权利要求1所述的一种基于K-means和Apriori的算法海事大数据关联分析的方法,其特征在于:所述步骤C中分析方法具体如下:
a、根据情况,设定合适的最小支持度minsupport和最小置信度minconfidence;
b、首先产生候选的...

【专利技术属性】
技术研发人员:李志杰汤小剑杨燕
申请(专利权)人:江苏蓝河智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1