一种基于维度重排序降低平行坐标可视化视觉杂乱的方法技术

技术编号:18525831 阅读:213 留言:0更新日期:2018-07-25 12:43
本发明专利技术公开了一种基于维度重排序降低平行坐标可视化视觉杂乱的方法,包括如下步骤:首先计算样本在任意两个属性轴间的杂乱度,得到杂乱度矩阵;其次,根据杂乱度矩阵,寻找使得杂乱度之和最小的属性轴排列方式;最后按照得到的属性轴排列顺序将平行坐标轴绘制出来,得到杂乱度最低的平行坐标可视化视图。本发明专利技术有效地降低了平行坐标可视化因维度次序排列不当所产生的视觉杂乱,通过减少曲线的交叉点数量,为用户提供了更直观地了解、分析数据的功能。

【技术实现步骤摘要】
一种基于维度重排序降低平行坐标可视化视觉杂乱的方法
本专利技术涉及信息可视化领域,特别是一种基于维度重排序降低平行坐标可视化视觉杂乱的方法。
技术介绍
在互联网时代,信息的产生和传播速度得到飞速的发展,特别是随着大数据时代的到来,数据越来越呈现出高维度、大容量的趋势。人们在直接面对大量的数据时,通常难以抓取其中有价值的信息,从而做出新的决策来指导生产生活。随着可视化技术的不断发展,人们可以借助于图形图像和人机交互的方式,方便直观地对数据进行分析和探索。目前,可视化技术已在生物、医学、物理、化学等众多领域发挥着重要的作用,并且越来越多地受到人们的关注。现实生活中,人们通常只能感知到三维的世界,而人眼每个时刻仅能观察到二维的画面。因此在对高维数据进行可视化时,需要将数据投影到二维或三维空间中,再绘制成图形图像呈现给用户。现有的高维数据可视化方法有平行坐标(ParallelCoordinates)、雷达图(RadViz)、3D视图(Viz3D)等。平行坐标是一种高维数据可视化方法,它由Inselberg于1985年提出。平行坐标首先将各个维度属性依次投影到二维平面中,形成一列列方向一致、长度相等的平行坐标轴,每一个轴表示数据的一个维度属性。其次,将数据集在每个维度上的变化范围均匀地映射到相应的平行坐标轴上,使其具有对应的坐标刻度值。最后,通过将样本各维度数据投影到对应的坐标轴上,并依次连接起来,即得到该样本的平行坐标曲线。因为简单易用、表现直观、扩展性好等诸多优点,在近30多年来,平行坐标已经发展为最为流行的高维数据可视化方法之一。如其他高维数据可视化方法一样,平行坐标属性轴的排列顺序通常会影响人们对数据的观察和把握能力,良好的排列顺序能够帮助人们更容易地发现数据的整体趋势以及在各属性间的变化规律。现有的属性排列方法主要分为两类:基于维度相似性的方法、基于距离度量的方法。基于维度相似性的方法,通过计算不同属性维度间样本分布的相似程度,将相似度高的属性摆放在相邻的位置,以方便用户发现样本在不同维度间分布的相似规律;基于距离度量的方法,主要通过计算样本曲线间的距离从而减少离群曲线的数量,或通过计算曲线的长度并通过维度重排序使曲线长度之和最小。基于相似性的方法仅独立地考虑样本在各属性上的总体特性,分割了单个样本在各属性间的联系,忽略了属性轴间存在的视觉杂乱;基于距离度量的方法只适用于部分情况,而没有充分地反映视觉杂乱的本质。
技术实现思路
鉴于现在的平行坐标可视化在展示数据时因属性轴排列不当导致视觉杂乱较大的问题,本专利技术的目的是提供一种通过对属性维度进行重排序来降低视觉杂乱的方法,将视觉杂乱定义为曲线间的交叉点数,通过重新排列属性轴以减少样本间相互交叉、遮掩的现象,达到杂乱度最低的效果。实现本专利技术目的的技术方案如下:一种基于维度重排序降低平行坐标可视化视觉杂乱的方法,包括步骤1:输入数据集D={d1,d2,…,dm},其中,m为样本容量,di=(di,1,di,2,…,di,n),1≤i≤m,n为属性维数,属性集为A={A1,A2,…,An};若A中包含类别属性,则将其记为Aclass={C1,C2,…,Cl},class为类别属性所在的维度;若A中不包含类别属性则采用聚类方法获得样本类别属性并将其记为Aclass;各类别样本集合记为l为类别的数量;步骤2:计算样本在任意两个属性间的杂乱度Clutter(Ap,Aq),1≤p,q≤n,得到杂乱度矩阵Clutter;所述杂乱度为曲线间的交叉点数量;包括步骤2.1:根据不同类别样本代表曲线的交叉情况来进行计算,包括选择类别Ck的样本在属性Ap上的均值点上、下2σ点作为此类样本在属性Ap上的代表点,其比例系数分别表示代表点在属性Ap上所指代的样本比例,满足其中,1≤k≤l;将类别Ck样本在属性Ap上的代表点与属性Aq上的代表点两两组合,得到类别Ck的样本在这两个属性间的代表曲线,其曲线指代比例为代表点相应比例系数的乘积;判断不同类别样本相应组合的代表曲线的交叉情况,并根据其指代的数量,得到属性Ap和Aq间的近似交叉点数,根据代表曲线计算杂乱度的公式为:其中,曲线交叉判断函数Cross(*)为:上述杂乱度计算公式中,多项式的系数表示对应的代表曲线相交时,其所占总交叉点数的比例;所有多项式的系数之和为1,表示当所有对应代表曲线均相交时,交点数量为两类样本的数量之积,此时等价于原样本曲线中,一类中的任意一条曲线与另一类中的曲线均相交;当代表曲线均不相交时,杂乱度为0,表示原样本曲线中不存在曲线交叉的现象;步骤2.2:利用杂乱度计算得到任意两个属性轴Ap和Aq间的杂乱度,构造成杂乱度矩阵Clutter,满足当Ap≠Aq时,Clutter(Ap,Aq)=Clutter(Aq,Ap),当Ap=Aq时,Clutter(Ap,Aq)=0;步骤3:依据杂乱度矩阵Clutter,计算使得杂乱度之和最小的属性轴排列方式;步骤4:将平行坐标轴按照上述过程中得到的最优排列次序绘制出来,得到该数据集杂乱度最低的平行坐标可视化视图。与现有技术相比,本专利技术的积极效果是:一、区别于传统的平行坐标可视化,本专利技术有效降低了可视化的视觉杂乱。传统的平行坐标可视化直接按照数据的输入顺序将属性轴依次绘制出来,未经优化处理的属性轴排列方式通常会存在曲线交叉点多、遮盖现象严重等视觉杂乱情况。本专利技术通过优化属性轴的排列,使得可视化整体视图存在的杂乱现象达到最低。二、区别于现有的维度重排序方法,本专利技术将产生视觉杂乱更直观的原因——曲线交叉作为优化依据;同时区别于简单的曲线交叉优化方法,本专利技术提供更高效地近似计算方法。目前存在的方法主要依据维度相似性或曲线距离等来优化排序,很少直接与产生视觉杂乱的原因相关联。本专利技术从视觉直观出发,将视觉杂乱定义为曲线的交叉点数量,通过减少曲线的交叉情况,使各(类别)样本曲线间尽可能地分离,从而更容易实现对曲线的观察和分析。此外,简单地通过计算所有曲线的交叉点数或计算不同类别属性样本的交叉点数,通常需要较大的计算量。当样本容量较大时,计算开销将变得难以接受,极大地影响了方法的实用性。本专利技术通过采用代表曲线来近似计算不同类别样本间的交叉点数,有效地提高了计算曲线交叉点数的效率,提高了曲线交叉优化方法的实用性能。附图说明图1是代表点、代表曲线的示意图。图2是本专利技术在实验数据集Iris上的效果图。图3数据集Iris在原始平行坐标上的效果图。图4是本专利技术在实验数据集Cars上的效果图。图5是对比方法PCC在实验数据集Cars上的效果图。图6是对比方法Outlier在实验数据集Cars上的效果图。鉴于专利说明书附图对彩色表达的限制,特作如下说明:图2、图3中,类别属性Class为1、2、3的样本曲线颜色分别为color1、color2、color3;图4、图5、图6中,类别属性Origin为1、2、3的样本曲线颜色分别为color1、color2、color3。具体实施方式以下对本专利技术的具体实施方式进一步说明。步骤1:输入数据集D={d1,d2,…,dm},其中,m为样本容量,di=(di,1,di,2,…,di,n),1≤i≤m,n为属性维数,属性集为A={A1,A2,…,An};若A中包含类本文档来自技高网
...

【技术保护点】
1.一种基于维度重排序降低平行坐标可视化视觉杂乱的方法,其特征在于,包括步骤1:输入数据集D={d1,d2,…,dm},其中,m为样本容量,di=(di,1,di,2,…,di,n),1≤i≤m,n为属性维数,属性集为A={A1,A2,…,An};若A中包含类别属性,则将其记为Aclass={C1,C2,…,Cl},class为类别属性所在的维度;若A中不包含类别属性则采用聚类方法获得样本类别属性并将其记为Aclass;各类别样本集合记为

【技术特征摘要】
1.一种基于维度重排序降低平行坐标可视化视觉杂乱的方法,其特征在于,包括步骤1:输入数据集D={d1,d2,…,dm},其中,m为样本容量,di=(di,1,di,2,…,di,n),1≤i≤m,n为属性维数,属性集为A={A1,A2,…,An};若A中包含类别属性,则将其记为Aclass={C1,C2,…,Cl},class为类别属性所在的维度;若A中不包含类别属性则采用聚类方法获得样本类别属性并将其记为Aclass;各类别样本集合记为l为类别的数量;步骤2:计算样本在任意两个属性间的杂乱度Clutter(Ap,Aq),1≤p,q≤n,得到杂乱度矩阵Clutter;所述杂乱度为曲线间的交叉点数量;包括步骤2.1:根据不同类别样本代表曲线的交叉情况来进行计算,包括选择类别Ck的样本在属性Ap上的均值点上、下2σ点作为此类样本在属性Ap上的代表点,其比例系数分别表示代表点在属性Ap上所指代的样本比例,满足其中,1≤k≤l;将类别Ck样本在属性Ap上的代表点与属性Aq上的代表点两两组合,得到类别Ck的样本在这两个属性间的代表曲线,...

【专利技术属性】
技术研发人员:李天瑞李运隆龚勋彭博杜圣东
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1