一种基于表征学习的多维数据可视化控制方法技术

技术编号：32487695 阅读：63 留言：0更新日期：2022-03-02 09:53

本发明专利技术公开了一种基于表征学习的多维数据可视控制方法，该控制方法为：根据类别属性按照属性内容进行切分，连续值域范围的数值属性按照事先确定的划分粒度进行切分；将所有子集表征为特征向量，所述特征向量体现子集的整体特征；基于表征模型支持灵活的数据集切分以生成任意类型的子集，所述可视化控制通过调用表征模型实时地为全部子集生成表征向量，并生成子集投影；用户在子集投影中交互地选择离群的、聚簇的子集，并观察对比不同选择子集的数据特征以确定潜在的数据模式。该方法不仅帮助分析人员灵活地挖掘不同子集中的数据模式，而且弥补了现有技术仅关注单个子集数据模式的不足。不足。不足。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于表征学习的多维数据可视化控制方法

[0001]本专利技术涉及表征学习和数据可视化领域，尤其涉及利用表征学习模型对时空数据进行表征，并通过渐进式地可视分析来发现隐藏在数据中的不同模式，实现对多维数据的可视化控制。

技术介绍

[0002]从多维数据中挖掘数据模式是一个经典的可视化研究主题。传统方法往往关注数据记录层面的模式，使用各种机器学习算法寻找高维空间或子空间中潜在的数据记录聚簇，每个可能对应一个数据模式。
[0003]然而，很多数据模式与子集相关而不是与原始记录相关。将子集定义为包含任意数量的原始记录的集合，而被包含的原始记录的一个统计指标为子集的一个特征。事实上，每条原始记录可以被看作一个只包含单个元素的子集。从这个角度出发，可以认为探索子集间的数据模式是一个更加通用的多维数据探索任务。
[0004]探索与子集相关的数据模式是非常具有挑战性的原因在于：可以有几乎无限数量的划分方式在一个多维数据集上来生成子集，这形成了巨大的搜索空间。在没有先验知识的条件下，分析人员不得不尝试不同的子集划分方式，这是...

【技术保护点】

【技术特征摘要】
1.一种基于表征学习的多维数据可视化控制方法，其特征在于，所述控制方法为：根据类别属性按照属性内容进行切分，连续值域范围的数值属性按照事先确定的划分粒度进行切分；将所有子集表征为特征向量，所述特征向量体现子集的整体特征；基于表征模型支持灵活的数据集切分以生成任意类型的子集，所述可视化控制通过调用表征模型实时地为全部子集生成表征向量，并生成子集投影；用户在子集投影中交互地选择离群的、聚簇的子集，并观察对比不同选择子集的数据特征以确定潜在的数据模式。2.根据权利要求1所述的一种基于表征学习的多维数据可视化控制方法，其特征在于，所述表征模型使用sequence
‑
to
‑
sequence中的Autoencoder框架来实现，使用LSTM实现编码器和解码器，所述表征模型包括：数据预处理、快照编码和时空过程表征三个阶段，在数据预处...

【专利技术属性】
技术研发人员：李杰，赵丹宁，解鹏，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人