压缩和解压缩多维数据的方法技术

技术编号：43514344 阅读：70 留言：0更新日期：2024-11-29 17:16

本发明专利技术提供了一种将具有多个数据点的多维数据压缩成压缩文件的方法，包括：从多维数据生成多个超像素；将多个超像素聚类成多个超像素簇；用多个超像素簇分别训练多个字典；将多维数据分割为多个数据子块；对多个数据子块进行矢量化，得到多个矢量化数据子块；为每个矢量化数据子块选择一个字典；用所选字典对每个矢量化数据子块进行稀疏编码，得到压缩表示；以及将得到的压缩表示和相应的所选字典的索引存储在压缩文件中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及多维数据压缩，特别涉及一种基于稀疏表示的字典学习的多维数据压缩。

技术介绍

1、近年来，相机、激光雷达(lidar)、惯性测量单元(imu)等传感器被广泛使用，产生大量的多维数据，以用于描述复杂现象或系统，并捕捉不同维度之间的关系和相互作用。由于多维数据需要很高的精度以进行进一步的检查和测量任务，因此多维数据量非常大。此外，多维数据可能需要长期保存，占用大量内存。

2、基于稀疏表示的字典学习已被应用于各种应用中的数据压缩，如图像和视频压缩、医学成像和信号处理，其目的是使用一组稀疏的基本元素有效地表示信号或数据。字典学习允许对字典进行调整，以更好地适应被压缩数据的特征。这种自适应特性通过学习字典，以稀疏的方式捕捉数据的基本特征，从而更有效地表示复杂信号。通过促进稀疏性，基于稀疏表示的字典学习压缩技术有助于更有效地存储和传输数据，同时保留重要信息，因此非常有价值。然而，现有的大多数字典学习方法都是以串行方式学习训练样本，需要较长的计算时间。

技术实现思路

1、以下概述仅为说明性的，不具有任何限制性。也就是说，提供以下概述是为了介绍本文所述的新颖且非显而易见的技术的概念、亮点、益处和优势。下面的详细描述将进一步介绍所选的实施方案。因此，以下概述并不是为了确定所要求保护主题的必要特征，也不是为了确定所要求保护主题的范围。

2、本专利技术的目的是提出解决上述问题的解决方案，以对不同形式的多维数据进行压缩、高质量地重建压缩后的数据、高压缩率地节省内存使用、

3、在本专利技术的一个方面，提供了一种将具有多个数据点的多维数据压缩成压缩文件的方法。该方法包括：从多维数据生成多个超像素；将多个超像素聚类成多个超像素簇；使用多个超像素簇分别训练多个字典；将多维数据分割成多个数据子块；对多个数据子块进行矢量化，得到多个矢量化数据子块；为每个矢量化数据子块选择一个字典；用相应的所选字典对每个矢量化数据子块进行稀疏编码，得到压缩表示；将得到的压缩表示和相应的所选字典的索引存储在压缩文件中。通过以下方法为相应的矢量化数据子块选择每个字典：计算相应的矢量化数据子块与每个超像素簇之间的相似度；找到与矢量化数据子块相似度最高的最佳匹配超像素簇；选择用最佳匹配超像素簇训练的字典作为编码字典。每个字典都通过以下方式用相应的超像素簇进行训练：将相应的超像素簇划分为多个训练数据子块；将多个训练数据子块矢量化，分别得到多个初始表示；计算每对训练数据子块之间的相似度矩阵；计算每个训练数据子块的平均相似度值；根据计算的平均相似度值，从多个训练数据子块中选择多个初始训练数据子块；将初始训练数据子块设置为字典的初始原子来初始化字典；通过执行以目标稀疏度和目标残差阈值为约束的批量正交匹配追踪(batchomp)算法，来训练字典为每个训练数据子块构建稀疏编码表示；使用构建的稀疏编码表示逐个原子地更新字典，得到训练好的字典。

4、在本专利技术的另一方面，提供了一种从第一方面的方法获得的压缩文件中解压缩多维数据的方法。该方法包括：解码多个压缩表示，以获得多个解压缩数据子块；以及连接多个解压缩数据子块以重建多维数据。每个解压缩数据子块通过以下方式获得：根据相应索引检索相应字典；将压缩表示与检索到的字典相乘，以重建矢量化数据子块；以及对重建的矢量化数据子块进行去矢量化，以获得解压缩数据子块。

5、值得注意的是，尽管本文提供的描述可能是在某些基于稀疏表示的高质量压缩多维数据的数据处理技术的背景下，但使用诸如正交匹配追踪、批量正交匹配追踪、简单线性迭代聚类、拉普拉斯稀疏子空间聚类等算法的其他数据处理技术以及所提出的概念、方案及其任何变体/衍生物可以在其他类型的无线接入技术、网络和网络拓扑中实现，也可以由其他类型的无线接入技术、网络和网络拓扑实现。因此，本公开的范围并不限于本文描述的示例。

本文档来自技高网...

【技术保护点】

1.一种将具有多个数据点的多维数据压缩成压缩文件的方法，包括：

2.根据权利要求1所述的方法，其中执行批量OMP算法通过以下方式为每个训练数据子块构建稀疏编码表示：

3.根据权利要求1所述的方法，其中，所述多个超像素通过以下方式生成：以最大间隔初始化多个超像素中心；

4.根据权利要求3所述的方法，其中，相邻超像素中心到多维数据点的距离是根据相邻超像素中心到图像像素的颜色距离和空间距离来计算的。

5.根据权利要求4所述的方法，其中通过执行拉普拉斯稀疏子空间聚类算法对所述多个超像素进行聚类；所述拉普拉斯稀疏子空间聚类算法通过以下方式执行：

6.根据权利要求5所述的方法，其中每个超像素的特征向量是该超像素内所有像素的特征向量的平均值。

7.根据权利要求6所述的方法，其中超像素Ci的协方差矩阵Mi由以下公式给出：

8.根据权利要求7所述的方法，其中超像素i1和超像素i2的相似度值是根据所述超像素i1和i2的特征向量之间的距离来计算的。

9.根据权利要求8所述的方法，其中，所述加权无向图是通过以下方式进行分割的：

10.根据权利要求9所述的方法，所述最小化问题由所述稀疏系数、用于将所述稀疏系数投影到低维空间的线性变换矩阵、所述低维空间中的目标向量、以及所述稀疏系数和其他数据点的稀疏系数的L1范数来定义。

11.一种从通过权利要求1的方法获得的压缩文件中解压缩多维数据的方法，该方法包括：

12.根据权利要求11所述的方法，其中执行批量OMP算法通过以下方式为每个训练数据子块构建稀疏编码表示：

13.根据权利要求11所述的方法，其中所述多个超像素通过以下方式生成：以最大间隔初始化多个超像素中心；

14.根据权利要求13所述的方法，其中，相邻超像素中心到多维数据点的距离是根据所述相邻超像素中心到图像像素的颜色距离和空间距离来计算的。

15.根据权利要求14所述的方法，其中通过执行拉普拉斯稀疏子空间聚类算法对所述多个超像素进行聚类；所述拉普拉斯稀疏子空间聚类算法通过以下方式执行：

16.根据权利要求15所述的方法，其中每个超像素的特征向量是该超像素内所有像素的特征向量的平均值。

17.根据权利要求16所述的方法，其中超像素Ci的协方差矩阵Mi由以下公式给出：

18.根据权利要求17所述的方法，其中超像素i1和超像素i2的相似度值是根据所述超像素i1和i2的特征向量之间的距离来计算的。

19.根据权利要求18所述的方法，其中，所述加权无向图是通过以下方式进行分割的：

20.根据权利要求19所述的方法，所述最小化问题由所述稀疏系数、用于将所述稀疏系数投影到低维空间的线性变换矩阵、所述低维空间中的目标向量、以及所述稀疏系数和其他数据点的稀疏系数的L1范数来定义。

...

【技术特征摘要】
【国外来华专利技术】

1.一种将具有多个数据点的多维数据压缩成压缩文件的方法，包括：

2.根据权利要求1所述的方法，其中执行批量omp算法通过以下方式为每个训练数据子块构建稀疏编码表示：

3.根据权利要求1所述的方法，其中，所述多个超像素通过以下方式生成：以最大间隔初始化多个超像素中心；

4.根据权利要求3所述的方法，其中，相邻超像素中心到多维数据点的距离是根据相邻超像素中心到图像像素的颜色距离和空间距离来计算的。

6.根据权利要求5所述的方法，其中每个超像素的特征向量是该超像素内所有像素的特征向量的平均值。

7.根据权利要求6所述的方法，其中超像素ci的协方差矩阵mi由以下公式给出：

8.根据权利要求7所述的方法，其中超像素i1和超像素i2的相似度值是根据所述超像素i1和i2的特征向量之间的距离来计算的。

9.根据权利要求8所述的方法，其中，所述加权无向图是通过以下方式进行分割的：

10.根据权利要求9所述的方法，所述最小化问题由所述稀疏系数、用于将所述稀疏系数投影到低维空间的线性变换矩阵、所述低维空间中的目标向量、以及所述稀疏系数和其他数据点的稀疏系数的l1范数来定义。

11.一种从通过权利要...

【专利技术属性】
技术研发人员：田美静，尹廷熙，赵媛，
申请(专利权)人：香港应用科技研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人