一种基于四分位图展示数据的可视化方法及系统技术方案

技术编号:9489711 阅读:100 留言:0更新日期:2013-12-25 23:30
本发明专利技术提供一种基于四分位图展示数据的可视化方法,该方法包括:定义数据格Gx,并确定X轴的展示刻度步骤;进行数据源配置、扫描和读取步骤;分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤;采用四分位图进行数据展示步骤。本发明专利技术通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。另外,本发明专利技术还提供一种基于四分位图展示数据的可视化系统。

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种基于四分位图展示数据的可视化方法,该方法包括:定义数据格Gx,并确定X轴的展示刻度步骤;进行数据源配置、扫描和读取步骤;分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤;采用四分位图进行数据展示步骤。本专利技术通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。另外,本专利技术还提供一种基于四分位图展示数据的可视化系统。【专利说明】—种基于四分位图展示数据的可视化方法及系统
本专利技术涉及数据处理领域,尤其涉及一种基于四分位图展示数据的可视化方法及系统。
技术介绍
四分位图是一种展示一维数据分布情况的图形,能直观表现出数据的分布形态,包括五个数据点:最低位、四分之一位、中值位、四分之三位、最高位。其中最低位、最高位分别对应最小值、最大值,四分之一位含义为所有数据中有25%的数据小于该值,同理中值位为所有数据中有50%小于该值,四分之三位为所有数据中有75%小于该值。四分位图只是个展示工具,且只能用来展示一维数据分布情况。因而缺少一种采用四分位图展示二维数据分布情况的可视化方法。
技术实现思路
因此,本专利技术为了解决上述缺陷之一。因而,本专利技术提供一种基于四分位图展示数据的可视化方法及系统,本专利技术通过定义数据格Gx来存储数据,并且X轴的四种展示刻度间相互切换,采用四分位图来展示数据,实现在数据量巨大或大数据环境下展示二维数据的分布情况,并提供交互功能。所以,本专利技术一个实施例提供一种基于四分位图展示数据的可视化方法,该方法包括: 定义数据格Gx,并确定X轴的展示刻度步骤; 进行数据源配置、扫描和读取步骤; 分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤; 采用四分位图进行数据展示步骤。在本专利技术一个实施例中,所述定义数据格Gx,并确定X轴的展示刻度步骤包括:计算自变量X的取值范围,并对自变量X进行离散化。在本专利技术一个实施例中,所述定义数据格Gx,并确定X轴的展示刻度步骤还包括:根据自变量X的取值范围对X的最大和最小值进行调整,进而将所述取值范围划分成一系列等分的Gx。优选地,所述展示刻度为4种,并可相互进行切换。在本专利技术一个实施例中,所述进行数据源配置、扫描和读取步骤包括: 依据自变量X和因变量Y进行数据源配置; 获取自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正; 扫描数据源,读取每一记录的X与Y值:X和y,并计算出X和I对应的数据格GX,将所述数据保存到该Gx中。优选地,所述计算每一刻度级别的每一数据格Gx内数据的四分位包括:最低位、四分之一位、中值位、四分之三位和最高位。在本专利技术一个实施例中,所述采用四分位图进行数据展示步骤包括:所述采用四分位图进行数据展示的数据为数据格Gx中存储的数据。优选地,所述采用四分位图进行数据展示步骤还包括:所述展示可进行上限或下限单方向修改和范围整体拖动。优选地,所述采用四分位图进行数据展示步骤还包括: 所述展示可选择一片区域进行,所述展示为对应数据格Gx内详细信息。本专利技术另一个实施例提供一种基于四分位图展示大数据的可视化系统,该系统包括:数据格定义单元,用于定义数据格Gx,并确定X轴的展示刻度;数据源获取单元,用于进行数据源配置、扫描和读取;数据源存储单元,用于分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位;数据展示单元,用于采用四分位图进行数据展示。所述数据源获取单元根据数据格定义单元确定的自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,并扫描数据源,读取每一记录的X与Y值:X和y,计算出X和y对应的数据格Gx。所述数据展示单元展示的数据为数据源存储单元存储的数据格Gx内的数据。【专利附图】【附图说明】图1是本专利技术一个实施例提供的一种基于四分位图展示数据的可视化方法的具体流程示意图。图2是本专利技术一个实施例中定义的数据格Gx的示意图。【具体实施方式】为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本专利技术,并不用于限定本专利技术。本专利技术提供一种基于散点图展示数据的可视化方法及系统,本专利技术通过定义数据格Gxy来存储数据,并利用散点图来展示数据,实现了在数据量巨大情况下的数据展示的可视化,可用于数据展示和数据分析。如图1是本专利技术一个实施例提供一种基于四分位图展示数据的可视化方法具体流程示意图,具体为以下步骤: 步骤SllO:定义数据格Gx,并确定X轴的展示刻度。在本专利技术一个实施例中,为了展示二维四分位图需要先计算自变量X的取值范围,并对自变量X进行离散化。并根据自变量X的取值范围对X的最大和最小值进行调整,进而将所述取值范围划分成一系列等分的Gx。如图2所示对数据格Gx作如下定义: Gx{xl,x2}为 G{ (X,y) I xl〈=x〈x2},简称 Gx,即所有满足 xl〈=x〈x2 的点(x, y)。步骤S120:进行数据源配置、扫描和读取。该步骤中,数据源依据自变量X和因变量Y进行数据源配置,并获取自变量X的最小值和最大值,依据取值区间对最大值和最小值进行修正,使得最小值、最大值为10的η次方(η为整数)的倍数,即Xmin (或Xmax) = m * 10~n。如X的实际取值区间为,进行修整后X的最小值为O,最大值为1000,即取值区间变为:。依据修正后的X轴取值区间划分成一系列等距的Gx,Gx的间距刻度Sx将会动态的识别成10的η次方(η为整数),即s=10~n,可能的取值为1、10、100、1000000、0.1,0.01等。同时为了支持缩放功能,本系统将同时支持3种Gx展示刻度,并支持切换(η连续,每切换一次,对应的将放大、缩小10倍)。4种Gx展示刻度将动态识别,识别的标准为使得最大展示刻度时X轴被等分成10-100个Gx,如X数据的分布区间为O到50000,那么本系统支持的Gx的展示刻度将为:1、10、100、1000。扫描数据源,读取每一记录的X、Y值χ和y,并计算出χ和y对应的数据格Gx,将所述数据保存到该Gx中。如x=155.3且X轴刻度为“10”时,155.3/10 = 15.53,则Gx为Gx {150, 160},当刻度为 I 时则属于 Gx {155,156}。步骤S130:分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位。读取数据完毕后,分析存储的数据,修正X轴展示刻度,如果某个小级别的刻度中有效的Gx数量(Gx中记录数大于O则称该Gx有效)小于上级的有效Gx数量的2倍,则删除该刻度。删除该刻度的原因是当放大到该级别时,信息增加的并不多,实际数据明细并没有得到有效的放大。确定保留的有效展示刻度中最大的为初始展示的刻度。所述计算每一刻度级别的每一数据格Gx内数据的四分位包括:最低位、四分之一位、中值位、四分之三位和最闻位。步骤S140:采用四分位图进行大数据展示。在本专利技术一个实施例中,所述采用四分位图进行数据展示的数据为G本文档来自技高网...

【技术保护点】
一种基于四分位图展示数据的可视化方法,其特征在于,所述方法包括:定义数据格Gx,并确定X轴的展示刻度步骤;进行数据源配置、扫描和读取步骤;分析存储数据与修正X轴展示刻度,进而计算每一刻度级别的每一数据格Gx内数据的四分位步骤;采用四分位图进行数据展示步骤。

【技术特征摘要】

【专利技术属性】
技术研发人员:王明兴樊文飞贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1