【技术实现步骤摘要】
一种基于最优传输理论的高维数据可视化方法
本专利技术属于维数缩减和可视化
,涉及一种基于最优传输理论的高维数据可视化方法。
技术介绍
随着可用计算资源和传感设备数量的不断增加,我们收集和生成各种大型复杂数据集的能力不断增强。高维数据集出现在许多研究领域,如经济学、生物学、化学、政治学、天文学和物理学等。它们的广泛可用性、不断增加的规模和复杂性在对其进行有效的可视化领域中带来了新的挑战和机遇。例如,生物学中的基因组微阵列、空气质量研究中的光谱数据、核安全工程中的模拟参数和燃烧模拟中的化学成分[5]都可以映射到高维空间(几十到几百维)进行探索。另一方面,由于显示设备和我们的视觉系统的物理限制,无法直接显示和快速识别尺寸大于2或3的结构。在过去的十年中,人们引入了多种方法来利用低维投影或抽象来视觉传达高维结构信息:从降维到视觉编码,从定量分析到交互式探索。许多调查集中在高维数据可视化的不同方面,如平行坐标、质量度量、减少杂波、可视化数据挖掘和交互技术。多变量科学数据集也在其中进行了研究,而其他研究则集中在视觉编码技术 ...
【技术保护点】
1.一种基于最优传输理论的高维数据可视化方法,其特征在于,该方法包括以下步骤:/nS1:对原始高维数据进行数据预处理和归一化;/nS2:基于最优质量传输迭代收缩采样点;每次迭代过程先计算最优传输方案,然后根据最优传输方案将采样点移动到点集质量重心;/nS3:计算每个骨架点之间的连接关系,连接骨架点,构建骨架分支;/nS4:根据对称SNE公式求解高低维的各点对其他点的高斯分布和,构成高斯分布矩阵;/nS5:计算距离矩阵,并最小化Wasserstein距离得到传输计划矩阵;/nS6:利用传输计划矩阵并根据能量函数求解低维坐标。/n
【技术特征摘要】
1.一种基于最优传输理论的高维数据可视化方法,其特征在于,该方法包括以下步骤:
S1:对原始高维数据进行数据预处理和归一化;
S2:基于最优质量传输迭代收缩采样点;每次迭代过程先计算最优传输方案,然后根据最优传输方案将采样点移动到点集质量重心;
S3:计算每个骨架点之间的连接关系,连接骨架点,构建骨架分支;
S4:根据对称SNE公式求解高低维的各点对其他点的高斯分布和,构成高斯分布矩阵;
S5:计算距离矩阵,并最小化Wasserstein距离得到传输计划矩阵;
S6:利用传输计划矩阵并根据能量函数求解低维坐标。
2.根据权利要求1所述的一种基于最优传输理论的高维数据可视化方法,其特征在于,所述步骤S1具体包括:对原始高维数据点集进行随机采样,得到新的采样点集,然后对原始数据点集进行质量分配,同时保证两个点集的总质量相同。
3.根据权利要求1所述的一种基于最优传输理论的高维数据可视化方法,其特征在于,步骤S2中,所述迭代收缩采样点包括:首先初始化传输代价矩阵;其次使用熵约束法更新最优传输计划,得到新的传输矩阵;最后更新采样点坐标。
4.根据权利要求1所述的一种基于最优传输理论的高维数据可视化方法,其特征在于,所述步骤S3具体包括:首先选择不在任何骨架分支上的骨架点;其次搜索相邻骨架点,纳入分支中;最后继续搜索直到所有的骨架点都位于分支上。
5.根据权利要求1所述的一种基于最优传输理论的高维数据可视化方法,其特征在于,所述步骤S4包括:选择高维点集中的任意一点,求该点到剩余点的高斯分布和,同理选择随机分布的低维点集中的任...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。