当前位置: 首页 > 专利查询>苏州大学专利>正文

一种数据可视化方法及系统技术方案

技术编号:7996331 阅读:188 留言:0更新日期:2012-11-22 05:10
本发明专利技术提供了一种数据可视化方法,包括:获取第一数据集并计算所述第一数据集中每个数据的可视化坐标,得到与所述第一数据集对应的可视化坐标集,其中,所述第一数据集包括n个D维数据,n为大于等于1的正整数,D为大于等于1的正整数;获取第二数据集并利用稀疏矩阵求加权值的方法增量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将每次处理得到的每个数据的可视化坐标加入到与所述第一数据集对应的可视化坐标集中,其中,N为大于n的正整数;输出与所述第一数据集对应的可视化坐标集。本发明专利技术还提供了一种数据可视化系统。本发明专利技术提供的数据可视化方法和系统提高了数据处理速度。

【技术实现步骤摘要】

本专利技术涉及数据可视化
,尤其涉及一种数据可视化方法及系统
技术介绍
由于人们获得关于外在世界的信息,80%以上是通过视觉器官获得的,因此,提供人眼能感知的可视化数据是非常重要的。数据可视化技术指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交 互处理的理论、方法和技术。目前,降维是数据可视化的一种有效手段,降维的有效方法为局部线性嵌入(Locally Linear Embedding, LLE)方法,然而,由于局部线性嵌入LLE方法是在批处理模式下运作的,在获取新样本后,要重新运行整个方法,因此,时间复杂度会随样本的增加而増加,即局部线性嵌入LLE方法处理数据的速度慢。
技术实现思路
有鉴于此,本专利技术提供了一种数据可视化方法和系统,用以解决现有的局部线性嵌入LLE方法处理数据的速度慢的问题,其技术方案如下一种数据可视化方法,包括A:获取第一数据集并计算与所述第一数据集对应的可视化坐标集,其中,所述第一数据集包括n个D维数据,n为大于等于I的正整数,D为大于等于I的正整数;B:获取第二数据集并利用稀疏矩阵求加权值的方法増量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将毎次处理得到的每个数据的可视化坐标加入到与所述第一数据集对应的可视化坐标集中,其中,N为大于n的正整数;C:输出与所述第一数据集对应的可视化坐标集。所述计算与所述第一数据集对应的可视化坐标集具体为利用局部线性嵌入LLE方法计算与所述第一数据集对应的可视化坐标集。所述利用稀疏矩阵求加权值的方法増量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将毎次处理得到的每个数据的可视化坐标加入到与所述第一数据集对应的可视化坐标集中具体为BI :从所述第二数据集中获取ー个数据;B2:在所述第一数据集中查找当前获取的数据的K个邻近点,K个邻近点组成邻近点集;B3 :在与所述第一数据集对应的可视化坐标集中查找与所述邻近点集对应的可视化坐标集;B4 :利用所述邻近点集线性表示所述当前获取的数据;B5:利用所述当前获取的数据的线性表示依据预设规则计算对应所述当前获取的数据的稀疏加权系数;B6:利用所述稀疏加权系数及与所述邻近点集对应的可视化坐标集计算所述当前获取的数据的可视化坐标;B7:将所述当前获取的数据添加至所述第一数据集中,将所述当前获取的数据的可视化坐标添加至与所述第一数据集对应的可视化坐标集中;B8 :判断所述第二数据集中是否还有未获取的数据,如果是,则转入步骤BI ;如果否,则执行步骤C。所述当前获取的数据的线性表示具体为权利要求1.一种数据可视化方法,其特征在于,包括 A:获取第一数据集并计算与所述第一数据集对应的可视化坐标集,其中,所述第一数据集包括η个D维数据,η为大于等于I的正整数,D为大于等于I的正整数; B:获取第二数据集并利用稀疏矩阵求加权值的方法增量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将每次处理得到的每个数据的可视化坐标添加至与所述第一数据集对应的可视化坐标集中,其中,所述第二数据集包括Ν-η个数据,N为大于η的正整数; C:输出与所述第一数据集对应的可视化坐标集。2.根据权利要求I所述的方法,其特征在于,所述计算与所述第一数据集对应的可视化坐标具体为 利用局部线性嵌入LLE方法计算与所述第一数据集对应的可视化坐标集。3.根据权利要求I或2所述的方法,其特征在于,所述利用稀疏矩阵求加权值的方法增量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将每次处理得到的每个数据的可视化坐标加入到与所述第一数据集对应的可视化坐标集中具体为 BI :从所述第二数据集中获取一个数据; Β2 :在所述第一数据集中查找当前获取的数据的K个邻近点,K个邻近点组成邻近点集; Β3 :在与所述第一数据集对应的可视化坐标集中查找与所述邻近点集对应的可视化坐标集; Β4 :利用所述邻近点集线性表示所述当前获取的数据; Β5 :利用所述当前获取的数据的线性表示依据预设规则计算对应所述当前获取的数据的稀疏加权系数; Β6 :利用所述稀疏加权系数及与所述邻近点集对应的可视化坐标集计算所述当前获取的数据的可视化坐标; Β7 :将所述当前获取的数据添加至所述第一数据集中,将所述当前获取的数据的可视化坐标添加至与所述第一数据集对应的可视化坐标集中; Β8 :判断所述第二数据集中是否还有未获取的数据,如果是,则转入步骤BI ;如果否,则执行步骤C。4.根据权利要求3所述的方法,其特征在于,所述当前获取的数据的线性表示具体为5.根据权利要求4所述的方法,其特征在于,所述利用所述当前获取的数据的线性表示依据预设规则计算对应所述当前获取的数据的稀疏加权系数,具体为通过最小化下式计算对应所述当前获取的数据的稀疏加权系数6.一种数据可视化系统,其特征在于,包括第一数据获取模块、第一数据处理模块、第二数据获取模块、第二数据处理模块和输出模块; 所述第一数据获取模块,用于获取第一数据集,其中,所述第一数据集包括η个D维数据,η为大于等于I的正整数,D为大于等于I的正整数; 所述第一数据处理模块,用于计算与所述第一数据集对应的可视化坐标集; 所述第二数据获取模块,用于获取第二数据集,其中,所述第二数据集包括Ν-η个D维数据,其中,N为大于η的正整数; 所述第二数据处理模块,用于利用稀疏矩阵求加权值的方法增量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将每次处理得到的每个数据的可视化坐标添加至与所述第一数据集对应的可视化坐标集中; 所述输出模块,用于输出与所述第一数据集对应的可视化坐标集。7.根据权利要求6所述的系统,其特征在于,所述第二数据处理模块包括数据获取子模块、第一数据查找子模块、第二数据查找子模块、线性表示子模块、第一计算子模块、第二计算子模块、数据添加子模块和判断子模块; 所述数据获取子模块,用于从所述第二数据集中获取一个数据; 所述第一数据查找子模块,用于在所述第一数据集中查找当前获取的数据的K个邻近点,所述K个邻近点组成邻近点集; 所述第二数据查找子模块,用于在与所述第一数据集对应的可视化坐标集中查找与所述邻近点集对应的可视化坐标集; 所述线性表示子模块,用于利用所述邻近点集线性表示所述当前获取的数据; 所述第一计算子模块,用于利用所述当前获取的数据的线性表示依据预设规则计算对应当前获取的数据的稀疏加权系数; 所述第二计算子模块,用于利用所述稀疏加权系数及与所述邻近点集对应的可视化坐标集计算当前获取的数据的可视化坐标; 所述数据添加子模块,用于将所述当前获取的数据添加至所述第一数据集中,并将当前获取的数据的可视化坐标添加至与所述与第一数据集对应的可视化坐标集中; 所述判断子模块,用于判断所述第二数据集中是否还有未获取的数据。全文摘要本专利技术提供了一种数据可视化方法,包括获取第一数据集并计算所述第一数据集中每个数据的可视化坐标,得到与所述第一数据集对应的可视化坐标集,其中,所述第一数据集包括n个D维数据本文档来自技高网...

【技术保护点】
一种数据可视化方法,其特征在于,包括:A:获取第一数据集并计算与所述第一数据集对应的可视化坐标集,其中,所述第一数据集包括n个D维数据,n为大于等于1的正整数,D为大于等于1的正整数;B:获取第二数据集并利用稀疏矩阵求加权值的方法增量式地处理所述第二数据集中的每个数据,得到所述第二数据集中每个数据的可视化坐标,并将每次处理得到的每个数据的可视化坐标添加至与所述第一数据集对应的可视化坐标集中,其中,所述第二数据集包括N?n个数据,N为大于n的正整数;C:输出与所述第一数据集对应的可视化坐标集。

【技术特征摘要】

【专利技术属性】
技术研发人员:张莉冷亦琴夏佩佩杨季文何书萍王邦军李凡长
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1