基于非均匀分段映射的平行坐标改进方法技术

技术编号:17733857 阅读:46 留言:0更新日期:2018-04-18 11:22
本发明专利技术涉及一种基于非均匀分段映射的平行坐标改进方法,属于计算机图形学与可视化技术领域。实现步骤为:针对数据集的每一维数据,将数据范围均分为多个分段,统计各分段的数据分段频次,并依此建立当前维的数据分段频次直方图。将各维数据的数据分段频次直方图融入相应的坐标轴,建立分段平行坐标系。调整分段平行坐标系坐标轴中各分段的高度占比,实现非均匀分段映射平行坐标系。针对数据集中的每一条数据,计算其在非均匀分段映射平行坐标系中的映射位置,并依此绘制基于非均匀分段映射的平行坐标可视化结果。本发明专利技术能够同时展现数据集中各维数据的分布规律及相邻维间的相关性关系,并降低可视化效果的重叠,提高可视分析效率。

An improved method of parallel coordinates based on inhomogeneous piecewise mapping

The invention relates to an improved method of parallel coordinates based on nonuniform piecewise mapping, which belongs to the field of computer graphics and visualization. The implementation steps are as follows: for every one-dimensional data set of the data set, the data range is divided into multiple segments, the data segmentation frequency of each segment is counted, and the histogram of data segmentation frequency of current dimension is established based on this. The piecewise parallel coordinate system is set up by integrating the frequency histogram of each dimension data into the corresponding coordinate axis. The height occupation ratio of each subsection in the coordinate axis of the piecewise parallel coordinate system is adjusted, and the non uniform piecewise mapping parallel coordinate system is realized. Aiming at every data in data set, we calculate its mapping position in the non-uniform piecewise mapping parallel coordinate system, and draw the parallel coordinate visualization results based on non-uniform piecewise mapping. The invention can simultaneously display the distribution rule of each dimension data in the data set and the correlation between adjacent dimensions, and reduce the overlap of visualization effect, and improve the efficiency of visual analysis.

【技术实现步骤摘要】
基于非均匀分段映射的平行坐标改进方法
本专利技术涉及一种针对多维数据可视化的平行坐标改进方法,属于计算机图形学与可视化
技术背景平行坐标是针对多维数据集进行可视化和可视分析的常用方法,在平行坐标可视化结果中,将多维数据的各个维用一系列相互平行的坐标轴表示,一个在多维空间的数据点被表示为一条拐点在N条平行坐标轴的折线,在第K个坐标轴上的位置就表示这个点在第K维的数据值。在平行坐标可视化结果中,当数据集的数据分布很不均匀(即数据大量集中于某些数据点周围)时,容易发生严重的可视化结果重叠问题,对可视分析过程造成很大的困扰。本专利技术针对传统的平行坐标可视化方法,提出一种将各维对应的坐标轴进行分段,并在各分段之间实现不同比例的数据映射,从而提高平行坐标对不均匀分布的多维数据集的可视化能力。在已公开的文献中,还未发现同类技术。
技术实现思路
本专利技术的目的是针对平行坐标可视化方法提出一种改进措施,使其在针对很不均匀的多维数据集进行可视化时,能够提高其表达能力。本专利技术提出的一种基于非均匀分段映射的平行坐标改进方法,包含如下步骤:步骤1:针对数据集的每一维数据,从数据的最小值至最大值的数据范围均分为多个分段。分段数由用户设定,一般需根据数据类型和内容设定,同一数据集中的不同数据维的分段数量可以不同。如第i维数据的最小值为mini,最大值为maxi,设定该维数据分段数量为Ni,则每个分段的大小为segi=(maxi-mini)/Ni,第i维数据的第j分段的范围如公式(1)所示,Rangei,j=[mini+segi*(j-1),mini+segi*j)(1)最大值包含在最后一分段中。步骤2:针对数据集的每一维数据,统计该维数据在每一分段中出现的次数,简称为数据分段频次。步骤3:针对数据集的每一维数据,基于步骤2中得出的数据分段频次,建立描述当前维的数据分段频次的直方图。建立方法为:直方图的横坐标为数据分段,纵坐标为数据分段频次。根据直方图的定义,每一维数据所对应的直方图,可表示该维数据的分布规律。步骤4:基于数据集中的每一维数据的数据分段频次直方图,将直方图信息融入平行坐标系的相应坐标轴中,形成融合数据分段频次分布直方图的平行坐标系(简称分段平行坐标系)。建立方法为:针对数据集中的每一维数据,将基于其数据分段频次建立的直方图,进行横纵坐标交换(即纵坐标为数据分段,横坐标为数据分段频次),并进行横坐标放缩,与平行坐标系中该维数据对应的坐标轴结合。通过分段平行坐标系,能快速观察各维数据的数据分布情况。步骤5:调整分段平行坐标系中的坐标轴各分段的高度占比。调整的原则主要为使数据频次较大的分段拥有较大的高度占比,而使数据频次较小的分段占据较小的高度占比。针对某一维数据对应的坐标轴中,某一数据分段的调整后高度占比的计算方法如公式(2)所示:其中,Hi是调整后的分段高度;k是调整系数,其取值范围为k∈[0,1],k值越大则调整越明显,反之k值越小则调整越不明显,可根据需求进行自由调整;当k=0时即为不调整(各分段高度相同),k=1时各分段的高度占比与对应分段的数据频次比例相同,一般可以取0.7;Hd是当前维对应坐标轴的总高度,n是当前维的分段数量,Fi是当前分段的数据频次。调整后,当前维对应的坐标轴的n个分段中,第1个分段在坐标轴上的高度范围为[0,H1],第2至n个分段中第i个分段在坐标轴上的高度范围为第2至n个分段中第i个分段在坐标轴上的高度范围为经过调整后的分段平行坐标系,每一维数据对应的坐标轴中的各个分段其映射比例不同,调整后的分段平行坐标系称为非均匀分段映射平行坐标系。步骤6:针对数据集中的每一条数据,计算其在非均匀分段映射平行坐标系中各坐标轴上的映射位置。针对一条数据,计算其在第i个坐标轴上的映射高度的计算方法为:步骤6.1:针对该条数据,取其第i维的数据值,命名该数据值为d;步骤6.2:根据步骤1中的分段范围,获知数据d在第i维的分段中所属的分段,命名该分段为s,并获取该分段所对应的数值范围步骤6.3:根据分段s在当前维的所有分段中的顺序号和步骤5中获得的各分段在坐标轴上的高度范围,获得分段s的坐标轴高度范围步骤6.4:根据公式(3)计算该条数据中第i维的数据值d在分段平行坐标系中的当前坐标轴上的映射高度值,其中,d为步骤6.1中该条数据第i维的数据值,和为步骤6.2中数据d所属分段的数值范围低值和高值,和是步骤6.3中获得的分段s的坐标轴高度范围低值和高值。步骤6.5:针对该条数据的其他维数据值,执行步骤6.1至步骤6.4得到该条数据所有维的数据值在相应坐标轴上的映射高度值。步骤6.6:针对该条数据的每一维数据值在相应坐标轴上的映射高度值,与相应坐标轴共同组成该条数据在各坐标轴上的映射位置。步骤6.7:针对数据集中的所有数据,执行步骤6.1至步骤6.6,计算每条数据在非均匀分段映射平行坐标系中各坐标轴上的映射位置。步骤7:绘制改进后的基于非均匀分段映射的平行坐标可视化结果。针对数据集中的每一条数据,连接其在各坐标轴上的映射位置,即可获得改进后的基于非均匀分段映射的平行坐标可视化结果,连接线可以使用折线或其他曲线。有益效果本专利技术提供了一种针对分布不均匀的多维数据集的可视化方法,提出的不均匀分段映射的平行坐标可视化方法,其有益效果包括:(1)通过将数据频次直方图进行变换后合并至坐标系,能够同时展现数据集中各维数据的分布规律,以及相邻维间的相关性关系,实现了多方面信息的综合展示。(2)通过针对传统平行坐标系中坐标轴的映射关系进行分段,并对各分段进行适当放缩,从而降低最终可视化结果中的重叠问题,提高平行坐标的可视化表现能力,更为有效的辅助数据分析人员进行数据集的可视分析。附图说明图1为本专利技术具体实施方式中实现不均匀分段映射的平行坐标可视化方法的实现流程图;图2为本专利技术具体实施方式中某维数据分段频次的直方图示意图;图3为本专利技术具体实施方式中分段平行坐标系示意图;图4为本专利技术具体实施方式中非均匀分段映射平行坐标系示意图;图5为本专利技术具体实施方式中使用折线连接的非均匀分段映射平行坐标可视化结果示例。具体实施方式下面结合附图和实施例,对本专利技术作进一步的说明。本实施例中使用的数据集的数据条数为30条数据,数据维数为4维。本实施例中所实现的一种基于非均匀分段映射的平行坐标改进方法,实现流程图如附图1所示,包含如下步骤:步骤1:针对数据集的每一维数据,从数据的最小值至最大值的数据范围均分为多个分段。分段数由用户设定,一般需根据数据类型和内容设定,同一数据集中的不同数据维的分段数量可以不同。以第1维数据为例,第1维数据的最小值为mini=-12.0,最大值为maxi=138.0,设定该维数据分段数量为Ni=5,则每个分段的大小为segi=(maxi-mini)/Ni=(138.0-(-12.0))/5=30.0,根据第i维数据的第j分段的范围公式(1),第1维第0-4分段的范围依次为[-12.0,18.0)、[18.0,48.0)、[48.0,78.0)、[78.0,108.0),根据最大值包含在最后一分段中的原则,第5分段的范围为[108.0,138.0]。步骤2:针对数据集的每一维数据,统计该维数据在每一分段中出现的次数本文档来自技高网...
基于非均匀分段映射的平行坐标改进方法

【技术保护点】
一种基于非均匀分段映射的平行坐标改进方法,包含如下步骤:步骤1:针对数据集的每一维数据,从数据的最小值至最大值的数据范围均分为多个分段。分段数由用户设定,一般需根据数据类型和内容设定,同一数据集中的不同数据维的分段数量可以不同。如第i维数据的最小值为mini,最大值为maxi,设定该维数据分段数量为Ni,则每个分段的大小为segi=(maxi‑mini)/Ni,第i维数据的第j分段的范围如公式(1)所示,Rangei,j=[mini+segi*(j‑1),mini+segi*j)  (1)最大值包含在最后一分段中。步骤2:针对数据集的每一维数据,统计该维数据在每一分段中出现的次数,简称为数据分段频次。步骤3:针对数据集的每一维数据,基于步骤2中得出的数据分段频次,建立描述当前维的数据分段频次的直方图。建立方法为:直方图的横坐标为数据分段,纵坐标为数据分段频次。根据直方图的定义,每一维数据所对应的直方图,可表示该维数据的分布规律。步骤4:基于数据集中的每一维数据的数据分段频次直方图,将直方图信息融入平行坐标系的相应坐标轴中,形成融合数据分段频次分布直方图的平行坐标系(简称分段平行坐标系)。建立方法为:针对数据集中的每一维数据,将基于其数据分段频次建立的直方图,进行横纵坐标交换(即纵坐标为数据分段,横坐标为数据分段频次),并进行横坐标放缩,与平行坐标系中该维数据对应的坐标轴结合。通过分段平行坐标系,能快速观察各维数据的数据分布情况。步骤5:调整分段平行坐标系中的坐标轴各分段的高度占比,建立非均匀分段映射平行坐标系。调整的原则主要为使数据频次较大的分段拥有较大的高度占比,而使数据频次较小的分段占据较小的高度占比。经过调整后的分段平行坐标系,每一维数据对应的坐标轴中的各个分段其映射比例不同,调整后的分段平行坐标系称为非均匀分段映射平行坐标系。步骤6:针对数据集中的每一条数据,计算其在非均匀分段映射平行坐标系中各坐标轴上的映射位置。针对一条数据,计算其在第i个坐标轴上的映射高度的计算方法为:步骤6.1:针对该条数据,取其第i维的数据值,命名该数据值为d;步骤6.2:根据步骤1中的分段范围,获知数据d在第i维的分段中所属的分段,命名该分段为s,并获取该分段所对应的数值范围[Vs...

【技术特征摘要】
1.一种基于非均匀分段映射的平行坐标改进方法,包含如下步骤:步骤1:针对数据集的每一维数据,从数据的最小值至最大值的数据范围均分为多个分段。分段数由用户设定,一般需根据数据类型和内容设定,同一数据集中的不同数据维的分段数量可以不同。如第i维数据的最小值为mini,最大值为maxi,设定该维数据分段数量为Ni,则每个分段的大小为segi=(maxi-mini)/Ni,第i维数据的第j分段的范围如公式(1)所示,Rangei,j=[mini+segi*(j-1),mini+segi*j)(1)最大值包含在最后一分段中。步骤2:针对数据集的每一维数据,统计该维数据在每一分段中出现的次数,简称为数据分段频次。步骤3:针对数据集的每一维数据,基于步骤2中得出的数据分段频次,建立描述当前维的数据分段频次的直方图。建立方法为:直方图的横坐标为数据分段,纵坐标为数据分段频次。根据直方图的定义,每一维数据所对应的直方图,可表示该维数据的分布规律。步骤4:基于数据集中的每一维数据的数据分段频次直方图,将直方图信息融入平行坐标系的相应坐标轴中,形成融合数据分段频次分布直方图的平行坐标系(简称分段平行坐标系)。建立方法为:针对数据集中的每一维数据,将基于其数据分段频次建立的直方图,进行横纵坐标交换(即纵坐标为数据分段,横坐标为数据分段频次),并进行横坐标放缩,与平行坐标系中该维数据对应的坐标轴结合。通过分段平行坐标系,能快速观察各维数据的数据分布情况。步骤5:调整分段平行坐标系中的坐标轴各分段的高度占比,建立非均匀分段映射平行坐标系。调整的原则主要为使数据频次较大的分段拥有较大的高度占比,而使数据频次较小的分段占据较小的高度占比。经过调整后的分段平行坐标系,每一维数据对应的坐标轴中的各个分段其映射比例不同,调整后的分段平行坐标系称为非均匀分段映射平行坐标系。步骤6:针对数据集中的每一条数据,计算其在非均匀分段映射平行坐标系中各坐标轴上的映射位置。针对一条数据,计算其在第i个坐标轴上的映射高度的计算方法为:步骤6.1:针对该条数据,取其第i维的数据值,命名该数据值为d;步骤6.2:根据步骤1中的分段范围,获知数据d在第i维的分段中所属的分段,命名该分段为s,并获取该分段所对应的数值范围[VsL,VsH);步骤6.3:根据分段s在当前维的所...

【专利技术属性】
技术研发人员:李慧马楠何勤
申请(专利权)人:北京联合大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1