大数据可视化分析方法及装置制造方法及图纸

技术编号:35431365 阅读:23 留言:0更新日期:2022-11-03 11:36
本发明专利技术涉及数据处理技术领域,一种大数据可视化方法及装置,包括:获取待可视化的数据集,构建三维坐标系并根据数据集在三维坐标系中构建初始可视化网格,依次计算在三维坐标系中每组二维形式数据的波动率,根据波动率选择出需执行插值处理的数据组得到待插值数据集,对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图。本发明专利技术可以提高可视化过程的智能性并规避资源浪费的问题。高可视化过程的智能性并规避资源浪费的问题。高可视化过程的智能性并规避资源浪费的问题。

【技术实现步骤摘要】
大数据可视化分析方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种大数据可视化分析方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]数据可视化是一种化繁为简,借助图形化的手段将数据赋予了可视化价值,不仅增加了数据的灵动性,也能帮助数据分析者更快发现数据趋势,意义重大。
[0003]目前数据可视化方法主要基于Python或MATLAB等工具先接收待可视化的数据集,然后通过内部的函数实现数据的图表化。这种方法普及性很高,具有重要意义。但由于传统的Python或MATLAB等工具实现可视化时并未考虑数据密度问题,仅是固化的根据输入数据形成图表,智能性不高,且生成图表的所有像素均相同,容易造成资源浪费。

技术实现思路

[0004]本专利技术提供一种大数据可视化分析方法、装置及计算机可读存储介质,其主要目的在于提高可视化过程的智能性并规避资源浪费的问题。
[0005]为实现上述目的,本专利技术提供的一种大数据可视化分析方法,包括:获取待可视化的数据集,所述数据集由三元组组成,其中,表示数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种大数据可视化分析方法,其特征在于,所述方法包括:获取待可视化的数据集,所述数据集由三元组组成,其中,表示数据集中第个数据的数据生成时间,表示时间下第组数据的二维形式的数据值;构建与三元组形式对应的三维坐标系,并根据所述数据集在三维坐标系中构建初始可视化网格,每个初始可视化网格的分辨率为:视化网格,每个初始可视化网格的分辨率为:其中,表示时间下第组数据对应的初始可视化网格的分辨率,为预设的最大分辨率,表示第组所有二维形式数据所构成的函数关系,表示函数关系对求偏导后在的偏导值,表示函数关系对求偏导后在的偏导值,表示时间下生成的所有数据的总组数,表示时间下所有的数据总值,表示时间下所有的数据总值;依次计算在三维坐标系中每组二维形式数据的波动率;根据波动率选择出需执行插值处理的数据组,得到待插值数据集;对所述待插值数据集执行插值计算得到多组插值数据,提高与每组插值数据对应的初始可视化网格的分辨率,得到弱化可视化网格,将每组插值数据插入至对应的弱化可视化网格后,根据每个弱化可视化网格及初始可视化网格生成与待可视化的数据集对应的可视化热图,其中可视化热图的颜色强弱由弱化可视化网格及初始可视化网格的分辨率决定。2.如权利要求1所述的大数据可视化分析方法,其特征在于,所述根据所述数据集在三维坐标系中构建初始可视化网格,包括:将所述数据集按照数据生成时间的先后顺序执行排列,得到具有时间顺序的数据集;依次将具有时间顺序的数据集中每组二维形式的数据值投射到所述三维坐标系中;以投射到三维坐标系的每个数据作为中心生成与其对应的初始可视化网格。3.如权利要求1所述的大数据可视化分析方法,其特征在于,所述依次计算在三维坐标系中每组二维形式数据的波动率,包括:采用如下公式计算得到波动率:采用如下公式计算得到波动率:
其中,表示第组所有二维形式数据的波动率,表示第组所有x形式数据的波动率,表示第组所有y形式数据的波动率,表示第组所有x形式数据的平均值,表示第组所有y形式数据的平均值,表示第组数据的数据总量。4.如权利要求1所述的大数据可视化分析方法,其特征在于,所述根据波动率选择出需执行插值处理的数据组,得到待插值数据集,包括:接收设定的第一波动阈值和第二波动阈值,其中第二波动阈值大于第一波动阈值;依次判断每组波动率与第一波动阈值和第二波动阈值的大小关系;将波动率小于第一波动阈值的数据组设置成直接可视化数据集;将波动率大于或等于第一波动阈值,但小于第二波动阈值的数据组设置成第一待插值数据集;将波动率大于或等于第二波动阈值的数据组设置成第二待插值数据集,其中第一待插值数据集和第二待插值数据集统称为所述待插值数据集。5.如权利要求4所述的大数据可视化分析方法,其特征在于,所述对所述待插值数据集执行插值计算得到多组插值数据,包括:依次从所述第一待插值数据集中提取数据生成时间相邻的两组待插值数据;根据下式计算得到相邻两组待插值数据的...

【专利技术属性】
技术研发人员:张煇李龙韩鑫磊朱晓娟
申请(专利权)人:山西长河科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1