基于数据结构识别的自动化可视化呈现方法与系统技术方案

技术编号:16216583 阅读:54 留言:0更新日期:2017-09-15 22:47
本发明专利技术公开了一种基于数据结构识别的自动化可视化呈现方法,包括如下步骤:接收数据输入,通过数据结构描述规则生成输入数据的数据结构描述信息;根据该数据结构描述信息,提取数据的结构特征向量信息;对提取的数据结构特征向量信息进行识别,并以此得出与该特性向量匹配的图表配置;根据图表配置信息生成多图表布局并得出可视化图形。另一方面本发明专利技术还提供了实现该方法的呈现系统,无需用户预先依据经验选择数据的可视化表现形式,从分析结果的数据结构入手,通过对数据结构中各个维度的类型、内容等信息进行识别匹配,自动对图表进行合理化配置,自动规划布局,解决传统的分析结果可视化呈现方法中存在的易用性问题。

Automatic visual presentation method and system based on data structure recognition

The invention discloses a method for presenting automation data structure visualization based on recognition, which comprises the following steps: receiving the input data, through the data structure to describe the data structure rule generating input data description information; according to the description of the data structure information, data structure of feature vector extraction; identify the data structure of feature vector extraction. And then gets the matching with the characteristics of vector graphics configuration; configuration information generated according to the chart and draw the visual chart layout. On the other hand, the invention also provides a display system for realizing the method, without the user in advance on the basis of experience selection of visual representation of data, starting from the data structure analysis results, through the recognition of each dimension in the data structure type, content and other information, reasonable configuration of automatic chart, automatic layout the analysis results, to solve the traditional visual presentation of usability problems existing in the method.

【技术实现步骤摘要】
基于数据结构识别的自动化可视化呈现方法与系统
本专利技术涉及海量数据分析工具
,具体为一种基于数据结构识别的自动化可视化呈现方法,以及基于数据结构识别的自动化可视化呈现系统。
技术介绍
随着全球信息化过程的逐渐完善,以及计算资源的日益廉价,社会各界越发关注海量数据的内在联系和数据分析挖掘技术的巨大应用前景,市场中涌现了大量的商业智能系统,其中的优秀产品提供了强大的数据存储、数据处理、建模分析与丰富的可视化呈现能力,极大地降低了普通用户发掘自身数据资源价值的门槛。然而对于最终用户而言,其更关注于使用预定义的分析场景得出结论以辅助决策,而非深入学习底层复杂的数据分析模型结构和系统的运作机制;同时视觉又占据人类获取信息途经的绝对首位,因此一套良好的分析结果呈现界面是所有商业智能产品所必备的组成部分,甚至其设计的好坏是整个系统成败的关键。当前市面上的商业智能系统均提供了允许用户自定义布局与内容的可视化呈现界面,但均需用户自行配置,一般采用如下的两种方式:1、由用户选择图表类型(饼图、柱图)以及样式,并选择该图表所使用分析结果中的字段信息(如图1-1所示);2、提供多个计算维度,允许用户向XY两个呈现维度任意放置数据维度,并选取相应的测量指标,依据固定规则生成图表(如图1-2所示);前者对用户的专业性要求很高,仅适合专业人员,不便于普通用户使用,后者虽针对用户选择的不同观测维度实现了一定的自动化可视化能力,但依赖固定的模式,仍需要用户手动选择布局形式,且生成的可视化呈现单一,冗长,不具备基本的联想功能,同样需要用户具备一定的可视化图形经验。有鉴于此,特提出本专利技术。
技术实现思路
本专利技术要解决的技术问题在于克服现有技术的不足,提供一种基于数据结构识别的自动化可视化呈现方法,通过分析处理数据结构,自动匹配合理的图表配置,降低操作难度,保证准确性;另一方面本专利技术还提供了基于数据结构识别的自动化可视化呈现系统。为解决上述技术问题,本专利技术采用技术方案的基本构思是:一种基于数据结构识别的自动化可视化呈现方法,包括如下步骤:接收数据输入,通过数据结构描述规则生成输入数据的数据结构描述信息;根据该数据结构描述信息,提取数据的结构特征向量信息;对提取的数据结构特征向量信息进行识别,并以此得出与该特性向量匹配的图表配置;根据图表配置信息生成多图表布局并得出可视化图形。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,还包括将数据结构特征向量以及与之匹配的多种图表配置存储起来形成图表配置与数据结构模型库;根据提取的数据结构特征向量信息在模型库中识别出与之相似的结构特征向量,基于识别得到的存储在模型库中的结构特征向量检索得到与该特性向量匹配度大于阈值的图表配置信息。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述数据结构描述规则包括:对数据中的列信息进行如下定义:(1)列号,定义当前列在数据所有列中的序号;(2)列名,定义当前列的原始名称;(3)列类型,定义当前列的数据类型;(4)列格式,定义当前列的数据格式;(5)列权重,定义当前列在数据所有列中的权重;对数据中的行信息进行如下定义:(6)行号,定义当前行在数据所有行中的序号。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述根据该数据结构描述信息,提取数据的结构特征向量信息包括:以数据结构描述信息中的列信息为参数,通过映射函数转换为多维特征向量输出。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述映射函数表示为:f(x)=(x[0],x[1],...,x[n]);以数据结构描述信息x中的列类型、列格式与列权重作为该映射函数的参数,通过针对不同列类型和列格式计算离散值,将数据结构描述信息映射为n维离散向量,列权重可用于进行加权干预与调整。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述根据提取的数据结构特征向量信息在模型库中识别出与之相似的结构特征向量包括:通过数据结构特征相似度识别函数f(x1,x2),计算输入的两个结构特征向量的相似度并返回;其中输入参数x1、x2分别为提取的数据结构特征向量和数据库中的结构特性向量;该识别函数f(x1,x2)如下所示:f(x1,x2)=d12*cos(θ)其中,d12为x1、x2之间的距离,n为向量维度,k为参数序号;d12值越小,两个结构特征向量越相似。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述基于识别得到的存储在模型库中的结构特征向量检索得到与该特性向量匹配度大于阈值的图表配置信息包括:通过图表配置推荐函数f(x,φ)在模型库中查找与指定结构特征向量相似度高于指定阈值的所有特征向量;φ作为相似度阈值,x为输入的数据结构特征向量,具体查找步骤为:遍历模型库中的所有的数据结构特征向量x’,调用所述结构特征相似度识别函数计算x与x’的相似度,如果相似度超过阈值φ,则x’作为候选,直至遍历结束;将所有候选x’依据其与x的相似度进行倒序排序,选择相似度最大的x’所对应的图表配置作为最终的推荐结果。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述根据图表配置信息生成多图表布局包括:预设图像矩形定义以及空间切分与布局算法,根据得到的图表配置信息,将配置的图表生成多图表布局。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,图像矩形定义规则如下:(1)图像的序号,以标记图表的次序;(2)图像最小宽度,以标记图表在布局中的最小宽度;(3)图像常规宽度,以标记图表在布局中的常规宽度;(4)图像最小高度,以标记图表在布局中的最小高度;(5)图像常规高度,以标记图表在布局中的常规高度;(6)图像最小宽高比,以标记图表在布局中的最小宽高比;(7)图像最大宽高比,以标记图表在布局中的最大宽高比;(8)图像常规宽高比,以标记图表在布局中的常规宽高比;(9)图像相关性系数,以标记图表间的相关性系数。进一步的,上述基于数据结构识别的自动化可视化呈现方法中,所述空间切分与布局算法通过函数f(x0,x1,...,xn),接受一个或多个图像矩形定义集合同时输入,并依据所输入的所有图像矩形定义集合对全体图表进行重新排布,具体包括:将宽W高H的图形空间在水平方向与垂直方向上划分为n和m等份,即形成nxm个宽为w=W/n、高为h=H/m的子空间;每个子空间依据行列序号进行编码,其中行序号记作i,取值从1至m,列序号记作j,取值从1至n,任意子空间可记作P(i,j);设置行游标ix与列游标jx,依次遍历图像矩形定义集合,并取出元素,通过图像矩形定义的宽和高判定图表应占用的连续子空间规模,并以此来移动行列游标,计算出合适的行列游标,以及待占用的子空间,并将所占用的子空间均标记为已占用,继续下一个元素重复过程,直到遍历完成,对全体图表进行排布,生成多图表布局。第二方面,本专利技术提供了一种基于数据结构识别的自动化可视化呈现系统,包括:结构信息描述生成模块:被配置为接收数据输入,通过数据结构描述规则生成输入数据的数据结构描述信息;数据结构特征提取模块:被配置为根据数据结构描述信息,提取数据的结构特征向量信息;数据结构特征相似度识别与推荐模块:被配置为对提取的数据结构特征向量信息进行识别,并以此得出与该本文档来自技高网
...
基于数据结构识别的自动化可视化呈现方法与系统

【技术保护点】
一种基于数据结构识别的自动化可视化呈现方法,其特征在于:包括如下步骤:接收数据输入,通过数据结构描述规则生成输入数据的数据结构描述信息;根据该数据结构描述信息,提取数据的结构特征向量信息;对提取的数据结构特征向量信息进行识别,并以此得出与该特性向量匹配的图表配置;根据图表配置信息生成多图表布局并得出可视化图形。

【技术特征摘要】
1.一种基于数据结构识别的自动化可视化呈现方法,其特征在于:包括如下步骤:接收数据输入,通过数据结构描述规则生成输入数据的数据结构描述信息;根据该数据结构描述信息,提取数据的结构特征向量信息;对提取的数据结构特征向量信息进行识别,并以此得出与该特性向量匹配的图表配置;根据图表配置信息生成多图表布局并得出可视化图形。2.根据权利要求1所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:还包括将数据结构特征向量以及与之匹配的多种图表配置存储起来形成图表配置与数据结构模型库;根据提取的数据结构特征向量信息在模型库中识别出与之相似的结构特征向量,基于识别得到的存储在模型库中的结构特征向量检索得到与该特性向量匹配度大于阈值的图表配置信息。3.根据权利要求1所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:所述数据结构描述规则包括:对数据中的列信息进行如下定义:(1)列号,定义当前列在数据所有列中的序号;(2)列名,定义当前列的原始名称;(3)列类型,定义当前列的数据类型;(4)列格式,定义当前列的数据格式;(5)列权重,定义当前列在数据所有列中的权重;对数据中的行信息进行如下定义:(6)行号,定义当前行在数据所有行中的序号。4.根据权利要求3所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:所述根据该数据结构描述信息,提取数据的结构特征向量信息包括:以数据结构描述信息中的列信息为参数,通过映射函数转换为多维特征向量输出。5.根据权利要求4所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:所述映射函数表示为:f(x)=(x[0],x[1],...,x[n]);以数据结构描述信息x中的列类型、列格式与列权重作为该映射函数的参数,通过针对不同列类型和列格式计算离散值,将数据结构描述信息映射为n维离散向量,列权重可用于进行加权干预与调整。6.根据权利要求2所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:所述根据提取的数据结构特征向量信息在模型库中识别出与之相似的结构特征向量包括:通过数据结构特征相似度识别函数f(x1,x2),计算输入的两个结构特征向量的相似度并返回;其中输入参数x1、x2分别为提取的数据结构特征向量和数据库中的结构特性向量;该识别函数f(x1,x2)如下所示:1f(x1,x2)=d12*cos(θ)其中,d12为x1、x2之间的距离,n为向量维度,k为参数序号;d12值越小,两个结构特征向量越相似。7.根据权利要求6所述的基于数据结构识别的自动化可视化呈现方法,其特征在于:所述基于识别得到的存储在模型库中的结构特征向量检索得到与该特性向量匹配度大于阈值的图表配置信息包括:通过图表配置推荐函数f(x,φ)在模型库中查找与指定结构特征向量相似度高于指定阈值的所有特征向量;φ作为相似度阈值,x为输入的数据结构特征向量,具体查找步骤为...

【专利技术属性】
技术研发人员:何毅荣陈成郑建全
申请(专利权)人:九次方大数据信息集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1