一种多源数据可视分析与展现方法及系统技术方案

技术编号:23238940 阅读:164 留言:0更新日期:2020-02-04 18:22
本发明专利技术公开了一种多源数据可视分析与展现方法及系统。多源数据可视分析与展现方法,包括:接收所有数据信息,对数据进行清洗,删除异常数据,得到数据样本集合;根据数据样本类型,选定聚类数K值的大小;将数据样本集合中的数据样本按最小距离原则分配到最邻近聚类;根据最临近聚类结果,重新计算K个聚类的中心,并作为新的聚类中心;判断是否收敛即判断聚类中心是否不再发生变化,若未收敛,重复直至收敛,得到最佳聚类结果;按照最佳聚类结果,为数据样本标上相应标签,与展示模板一一对应,进行展示。多源数据可视分析与展现系统,包括:数据样本处理模块;聚类数选定模块;临近聚类模块;聚类中心运算模块;最佳聚类运算模块;展示模块。

A method and system for visual analysis and presentation of multi-source data

【技术实现步骤摘要】
一种多源数据可视分析与展现方法及系统
本专利技术涉及数据分析
,特别是涉及一种多源数据可视分析与展现方法及系统。
技术介绍
随着民航需求的日益增长,机场所产生的各种类型的数据量呈上升趋势,如各种类的航班数据、旅客数据、保障数据等各类型的数据收集较为分散,导致数据收集分析过慢,导致展示数据实时性较差。目前,机场的可视化系统的根本目的是利用多媒体、多渠道,实现空管、机场、航空公司和驻场单位等部门单位的协同沟通,把各单位所拥有的数据信息进行融合,并把数据通过图表的形式展示出来,但收集的各种数据种类多数量大,难以对数据进行分析利用。
技术实现思路
基于此,本专利技术的目的在于,提供一种多源数据可视分析与展现方法及系统。本专利技术的多源数据可视分析与展现方法,包括:S1.接收所有数据信息,对数据进行清洗,删除异常数据,得到数据样本集合;S2.根据数据样本类型,选定聚类数K值的大小;S3.将数据样本集合中的数据样本按最小距离原则分配到最邻近聚类;S4.根据最临近聚类结果,重新计算K个本文档来自技高网...

【技术保护点】
1.一种多源数据可视分析与展现方法,其特征在于,包括:/nS1.接收所有数据信息,对数据进行清洗,删除异常数据,得到数据样本集合;/nS2.根据数据样本类型,选定聚类数K值的大小;/nS3.将数据样本集合中的数据样本按最小距离原则分配到最邻近聚类;/nS4.根据最临近聚类结果,重新计算K个聚类的中心,并作为新的聚类中心;/nS5.判断是否收敛即判断聚类中心是否不再发生变化,若未收敛,则重复上述S3和S4,直至收敛,得到最佳聚类结果;/nS6.按照最佳聚类结果,为数据样本标上相应标签,与展示模板一一对应,进行展示。/n

【技术特征摘要】
1.一种多源数据可视分析与展现方法,其特征在于,包括:
S1.接收所有数据信息,对数据进行清洗,删除异常数据,得到数据样本集合;
S2.根据数据样本类型,选定聚类数K值的大小;
S3.将数据样本集合中的数据样本按最小距离原则分配到最邻近聚类;
S4.根据最临近聚类结果,重新计算K个聚类的中心,并作为新的聚类中心;
S5.判断是否收敛即判断聚类中心是否不再发生变化,若未收敛,则重复上述S3和S4,直至收敛,得到最佳聚类结果;
S6.按照最佳聚类结果,为数据样本标上相应标签,与展示模板一一对应,进行展示。


2.根据权利要求1所述的多源数据可视分析与展现方法,其特征在于,所述S1中,所述数据信息包括登机人员信息、值机人员信息、安检人员信息、飞机在场航班信息、空中监控信息和飞机保障信息的一种或多种。


3.根据权利要求2所述的多源数据可视分析与展现方法,其特征在于,所述S6中,所述标签包括字母标签或数字标签。


4.根据权利要求3所述的多源数据可视分析与展现方法,其特征在于,所述S6中,所述展示模板包括折线图模板、柱状图模板、饼图模板。


5.根据权利要求4所述的多源数据可视分析与展现方法,其特征在于,所述S6中,所述进行展示,包括进行自动可视化图表展示。


6.根据权利要求1-5任一项所述的多源数据可视分析与展现方法,其特征在于,所述S2中,所述根据数据样本类型,选定聚类数K值的大小,包括:当数据样本类型的种类无法确定,无法确定K值时,随机选定K值,再使用轮廓系数方法计算K值大小。


7.根据权利要求6所述的多源数据可视分析与展现方法,其特征在于,所述当数据样本类型的种类无法确定,无法确定K值时,随机选定K值,再使用轮廓系数方法计算K值大小,包括:
根据可能的数据样本类型种类,设W≤K≤V,其中W<V,且W、V均为大于0的自然数,循环K值,分别计算得出聚类结果,并计算平均轮廓系数:
当K=W时,将接收的各种数据信息分为K=W类,S={S1,S2,...,SW},在此数值模型上,即对以下表达式求最小值:
根据上述表达式可得数学表达式:

其中,n为样本数,k为分类值,rnk为第n个样本点是否属于第k类,属于则rnk=1,否者rnk=0,μk为第K个中心点;
基于k-means思想,则要让表达式求出最小值,对于下述公式需要对其进行迭代,先对μk固定值,得出rnk,然后固定rnk的值,...

【专利技术属性】
技术研发人员:夏侯康曾林华王丽娟冯景亮
申请(专利权)人:广东机场白云信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1