一种基于ggplot2的可视化数据分析图形的绘制系统和方法技术方案

技术编号:33243562 阅读:11 留言:0更新日期:2022-04-27 17:50
本发明专利技术提出一种基于ggplot2的可视化数据分析图形的绘制系统和方法,其中该系统包括:用户指令模块,用于接收用户发出的用户指令;导入模块,用于根据该用户指令进行输入数据的导入;绘图模块,用于数据分析图形的绘制,包括绘图单元;该绘图单元包括单图模型和组合模型;该单图模型,包括散点图、箱线图和小提琴图;该组合模型,是两种该单图模型的组合,包括散点图+箱线图、散点图+小提琴图、箱线图+小提琴图;该绘图模块以接收到的该用户指令为参数,调用各个单元,进行绘图;导出模块,用于该数据分析图形的导出。本发明专利技术在图形组合化、形式多样化、颜色专业化、数据异源化等多方面取得了突破,为数据分析可视化提供了更丰富、更专业的选择。专业的选择。专业的选择。

【技术实现步骤摘要】
一种基于ggplot2的可视化数据分析图形的绘制系统和方法


[0001]本专利技术涉及数据分析领域,特别涉及数据分析的可视化技术。

技术介绍

[0002]在日常数据分析工作中,箱线图是常用工具之一,它可以帮助人们直观明了地识别数据中的异常值,判断不同数据的分布形态,因而在数据分析和期刊文章中得到了广泛的应用。
[0003]箱线图是在1977年由美国统计学家约翰
·
图基(John Tukey)专利技术的,它由五个数值点组成:最小值(min),第一(下)四分位数(Q1),中位数(median),第三(上)四分位数(Q3),最大值(max),也可以往盒形图里面加入平均值(mean)。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上(下)四分位数到最大(小)值之间的延伸线称为“触须(whisker)”。
[0004]随着数据体量的增加,以及数据类型的多样化,现阶段通过传统的箱线图进行分析,已无法满足数据呈现及分析的要求。现有的箱线图大概有以下几个方面的不足:
[0005]1)样式单一:目前箱线图缺少对图形边框、网格线、背景等的综合调整。
[0006]2)颜色方案少:现有箱线图绘图缺少专业的期刊配色方案集成,需要进行单独的配置,使用比较繁琐。
[0007]3)图形类型少:现有箱线图绘制只能够绘制单一的图形,无法很方便的绘制各种图形的组合图。

技术实现思路

[0008]本专利技术提供的技术方案解决了以下技术问题:
[0009]1)图形组合化:提供了多种单图模型和综合模型,可以方便地进行单一图形的绘制和组合图形的绘制,丰富了可绘制图形的类型。
[0010]2)形式多样化:样式种类丰富,设置方便、迅速,能够实现对图形边框、网格线、背景色等的多种组合样式的灵活调整,不用对每个元素进行单独的设置。
[0011]3)颜色专业化:配色方案专业、完整、丰富,可灵活地实现专业期刊配色和通用专业颜色模块的生成和映射,使得出图效果可以直接用于期刊发表,既高效又省事。
[0012]4)数据异源化:支持本地化数据和在线流式数据处理,可在本地和在线灵活部署配置。
[0013]第一方面,本专利技术实施例提出一种基于ggplot2的可视化数据分析图形的绘制系统,该系统包括:
[0014]用户指令模块,用于接收用户发出的用户指令。
[0015]导入模块,用于根据该用户指令进行输入数据的导入。
[0016]绘图模块,用于数据分析图形的绘制,包括绘图单元。该绘图单元包括单图模型和组合模型;该单图模型,包括散点图、箱线图和小提琴图;该组合模型,是两种该单图模型的
组合,包括散点图+箱线图、散点图+小提琴图、箱线图+小提琴图。该绘图模块以接收到的该用户指令为参数,调用各个单元,进行绘图。
[0017]导出模块,用于该数据分析图形的导出。
[0018]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制系统:
[0019]该系统还包括:样式模块,包含了图形样式组合。
[0020]该绘图模块还包括:样式设置单元,用于根据该用户指令适用该样式模块中的该图形样式组合,对该数据分析图形的图形样式进行设置。
[0021]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制系统:
[0022]该系统还包括:颜色模块,包含了配色方案。
[0023]该绘图模块还包括:颜色映射单元,用于根据该用户指令适用该颜色模块中的该配色方案,并根据该输入数据的变量数目抽取或者生成对应数量的颜色值集。
[0024]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制系统:
[0025]该导入模块导入的该输入数据,包括文件数据和/或流式数据。
[0026]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制系统,该绘图单元还包括:
[0027]方向判断单元,用于根据该用户指令控制该数据分析图形的显示方向,并转换该数据分析图形的随动元素的方向为相应方向,该随动元素的范围可进行设置。
[0028]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制系统,该绘图单元还包括:
[0029]元素样式单元,用于根据该用户指令对该数据分析图形中使用的元素的属性进行设置。
[0030]第二方面,本专利技术实施例提出一种基于ggplot2的可视化数据分析图形的绘制方法,该方法包括:
[0031]接收用户发出的用户指令;
[0032]根据该用户指令导入输入数据;
[0033]根据该用户指令进行绘图,得到数据分析图形;当该用户指令指示绘制单图时,调取单图模型进行该绘图,该单图模型包括散点图、箱线图和小提琴图;当该用户指令指示绘制组合图时,调取组合模型进行该绘图,该组合模型包括散点图+箱线图、散点图+小提琴图、箱线图+小提琴图;
[0034]导出该数据分析图形。
[0035]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制方法,该方法还包括:
[0036]当该用户指令包括了图形样式参数时,根据该图形样式参数调取相应的图形样式组合,对该数据分析图形进行设置。
[0037]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制方法,该方法还包括:
[0038]当该用户指令包括了颜色参数时,根据该颜色参数调取相应的配色方案,并根据该输入数据的变量数目抽取或者生成对应数量的颜色值集。
[0039]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制方法:
[0040]该输入数据,包括文件数据和/或流式数据。
[0041]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制方法,该方法还包括:
[0042]当该用户指令包括了方向参数时,根据该方向参数控制该数据分析图形的显示方向,并转换该数据分析图形的随动元素的方向为相应方向,该随动元素的范围可进行设置。
[0043]一些实施例中,本专利技术提供的一种基于ggplot2的可视化数据分析图形的绘制方法,该方法还包括:
[0044]当该用户指令包括了元素参数时,根据该元素参数对该数据分析图形中使用的元素的属性进行设置。
[0045]本专利技术的技术方案中使用的ggplot2是R语言的一个作图包,该作图包提供了很好的可视化理念,其核心理念是:1)数据和图形理念:能够方便地实现数据和图形元素的映射和分离;2)图层理念:图形的绘制可以通过图层叠加的方式进行分层展示;3)要素的组合:基于图层式的开发逻辑,可以快速实现各种图形要素的自由组合。
[0046]在数据分析可视化的实践中,本专利技术提供的技术方案以数据可视化的实际需求为核心,灵活应用了ggplot2的作图理念,以其为工本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ggplot2的可视化数据分析图形的绘制系统,其特征在于,所述系统包括:用户指令模块,用于接收用户发出的用户指令;导入模块,用于根据所述用户指令进行输入数据的导入;绘图模块,用于数据分析图形的绘制,包括绘图单元;所述绘图单元包括单图模型和组合模型;所述单图模型,包括散点图、箱线图和小提琴图;所述组合模型,是两种所述单图模型的组合,包括散点图+箱线图、散点图+小提琴图、箱线图+小提琴图;所述绘图模块以接收到的所述用户指令为参数,调用各个单元,进行绘图;导出模块,用于所述数据分析图形的导出。2.根据权利要求1所述的系统,其特征在于:所述系统还包括:样式模块,包含了图形样式组合;所述绘图模块还包括:样式设置单元,用于根据所述用户指令适用所述样式模块中的所述图形样式组合,对所述数据分析图形的图形样式进行设置。3.根据权利要求1所述的系统,其特征在于:所述系统还包括:颜色模块,包含了配色方案;所述绘图模块还包括:颜色映射单元,用于根据所述用户指令适用所述颜色模块中的所述配色方案,并根据所述输入数据的变量数目抽取或者生成对应数量的颜色值集。4.根据权利要求1所述的系统,其特征在于:所述导入模块导入的所述输入数据,包括文件数据和/或流式数据。5.根据权利要求1所述的系统,其特征在于,所述绘图单元还包括:方向判断单元,用于根据所述用户指令控制所述数据分析图形的显示方向,并转换所述数据分析图形的随动元素的方向为相应方向,所述随动元素的范围可进行设置。6.根据权利要求1所述的系统,其特征在于,所述绘图单元还包括:元素样式单...

【专利技术属性】
技术研发人员:刘港彪孙子奎
申请(专利权)人:上海派森诺医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1