快速压缩高光谱信号的矢量量化方案制造技术

技术编号:13986557 阅读:64 留言:0更新日期:2016-11-13 03:26
本发明专利技术针对高光谱图像数据量大的特点,提出了一种快速压缩高光谱图像的矢量量化方案。根据三维高光谱图像数据构建初始码书,根据初始码书的特征矩阵进行主成分提取获取初始码书主成分,排除特征矩阵中异常像素并提取其主成分,得到训练矢量主成分,根据码书主成分对训练矢量主成分进行聚类,获得最终码书,完成高光谱图像的压缩编码。本发明专利技术对码书和训练矢量进行PCA运算,使得矢量的大部分能量集中在低维部分,使得空间复杂度大大减小,同时对异常像素进行提取,减少码书受到少数相关性较小的像素的影响,提高码书质量。本发明专利技术不仅能保证图像恢复质量几乎不受影响、还能达到大大降低运算量,快速高效地完成高光谱图像压缩的目标。

【技术实现步骤摘要】

本专利技术属于高光谱图像信号处理领域,具体涉及一种快速压缩高光谱信号的矢量量化方案
技术介绍
高光谱遥感技术是20世纪80年代兴起的新型对地观测技术。这一技术将确定物质或地物性质的光谱特性与把握其空间和几何关系的特性革命性地结合在一起。成像光谱仪在空间成像的同时,以同一谱间分辨率记录下几十到几百组光谱数据,将它们叠合在一起,就可以得到一个高光谱图像立方体。从高光谱图像立方体的每个像元均可提取一条连续的光谱曲线。光谱特性为其获取的遥感数据提供了丰富的地物细节,在海洋遥感、植被研究、精细农业、地质勘察、大气和环境遥感以及军事侦察等方面获得了广泛的应用,并显现出巨大潜力。随着成像光谱技术的不断发展,人们对遥感对象的了解不断深入。与此同时,新的问题产生,给高光谱数据应用带来巨大挑战,即海量数据的存储与传输问题。高光谱数据的光谱分辨力和空间分辨力越来越高,数据量化深度也不断增加,同时卫星不间断周期性扫描次数也在不断增加。这些因素都导致了高光谱遥感图像数据量的急剧增长。如果每个像素灰度值用2字节存储,那么一幅大小为614×512×224的高光谱图像,大约需要140M字节。对于当今越来越紧张的信道资源来说,为了进行有效的传输,研究出快速有效的高光谱图像压缩方法是十分重要的。高光谱图像压缩的可行性在于图像数据的高相关性。数字图像压缩主要就是去除数据间存在的相关性或冗余度,二维静止图像的压缩主要是去除数据的空间冗余,而高光谱图像立方体相当于一个三维图像,在具有空间相关性的同时,还具有谱间相关性,高光谱图像的压缩主要在于去除这两类相关性。矢量量化技术压缩比高、编解码简单,是一种有效的快速数据压缩手段。矢量量化的原理是将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息,能在高压缩率和平均最小失真间获得最佳折衷。矢量量化由两大关键技术组成:码书设计和码字搜索。码书设计指寻找最优码书,使恢复图像与原始图像之间的失真达到最小,以保证重构图像较好的质量;码字搜索指快速地找到与输入矢量误差最小的码字。矢量量化的主要问题是其较高的运算复杂度,尤其是码书训练的过程,其计算量随着矢量维度的增加呈指数级增长。因此,需要寻找快速的码书搜索算法,在保证码书质量几乎不受影响的前提下,尽可能的降低运算量矢量量化中码书设计的经典算法是1980年由Linde、Buzo、Gray提出的LBG算法。它不需要事先知道输入矢量的概率分布,通过训练矢量集和一定的迭代算法来逼近最优码书。LBG算法的思想是:①随意选取N个训练矢量作为初始码书;②由这N个码矢量对所有的训练矢量进行划分,即分成N个集合,使每个集合中的矢量,都是与码书中各码字矢量欧氏距离中最小的;③由这N个集合的质心,得到新的码书;④如果这些码矢量与原来的码矢量变化小于某个阈值,就完成码书的训练,否则重新进行②、③步。LBG算法的思想比较简单,但存在两大缺点:一是对初始码书非常敏感,初始码书的选取,不但影响递推的收敛速度,而且影响码书的性能;二是训练时间长,不能自适应的跟踪图像信源的统计特性。
技术实现思路
本专利技术针对现有的高光谱图像压缩方案,在获得较高的图像恢复质量的同时,计算量较大的问题,提出了一种快速压缩高光谱图像的矢量量化方案。该方案能在保证图像恢复质量较降低运算复杂度之前的恢复质量相比几乎不变的情况下,大大降低运算复杂度,大大减少压缩所需时间。具体为:种快速压缩高光谱图像的矢量量化方法,读取高光谱图像数据构建初始码书Y,将初始码书做PCA运算,获得PCA特征矩阵U,从U的分量Ur中提取初始码书的主成分得到初始码书主成分YU;在训练矢量中排除异常像素,从排除异常像素的训练矢量中提取训练矢量主成分BU;记录训练矢量主成分对应的关系索引IB;根据初始码书主成分YU对训练矢量主成分BU进行聚类,所有矢量聚类后根据索引IB找到对应训练矢量,利用每个胞腔中找到的训练矢量的质心更新码书,获得最终训练矢量码书,将最终训练矢量码书和训练矢量码字索引进行存储并传输。构建初始码书Y具体为:读取三维高光谱图像数据,转化为二维矢量数据,将二维矢量数据的所有维度相加得到和值,根据和值将二维矢量数据排序,根据码书大小将排序后的矢量平均分成多份,取每份的质心作为初始码书。本专利技术进一步具体包括,从U的分量Ur中提取初始码书的初始码书的主成分具体包括:将同一波段的数据作为矩阵的相同列元素,矩阵中每一行为一个k维码子;根据码书Y的元素Yjr,j=1,2,…,N,r=1,2,…,k调用公式计算每个波段的样本均值,其中N为码书大小;根据各波段的样本均值和高光谱数据矩阵中各个波段的数据计算任意两个波段的协方差组成协方差矩阵C,根据协方差矩阵C的特征向量大小对C的特征向量排序得PCA特征矩阵,取特征矩阵U中预定分量与初始码书相乘得到初始码书主成分YU。本专利技术进一步具体包括,利用改进的RXD算法对训练矢量进行异常检测,记录异常像素的矢量值BRXD1,BRXD2,…,BRXDM和位置索引IRXD,从训练矢量中排除异常像素,对异常像素的矢量不压缩,直接传输其矢量值。所述将初始码书Y做PCA运算具体包括:将Y的每一行作为一个码子,Y的每一列为一个波段的数据,得到一个由N个k维行矢量组成的向量组,即根据公式r=1,2…,k计算每个波段的样本均值,根据公式Cij=E[(Yi-mi)(Yj-mj)T],i,j=1,2,…,k计算任意两个波段的协方差Cij,根据协方差构建协方差矩阵:寻找使得C可对角化的正交矩阵U作为PCA特征矩阵,其中,Yi,Yj表示高光谱数据矩阵中i,j波段的数据,mi(mj)表示对应i(j)波段的样本均值,E[·]表示求方括号中向量的数学期望。本专利技术进一步具体包括,将特征矩阵中预定分量Ur与训练矢量B1相乘得到训练矢量矩阵主成分BU,获取训练矢量和训练矢量主成分对应关系索引IB,依次将矩阵BU中的矢量利用高效排除不等式算法在初始码书主成分YU中快速搜索最佳匹配码字,依次将BU中的训练矢量划分到最佳匹配码字所对应的胞腔中,记录对应的码字索引,根据索引IB找到对应的原训练矢量。本专利技术进一步具体包括,根据第i个训练矢量的和值αi计算和值的累积分布函数Pr(a);给定可靠系数γ,找到满足Pr(a)≤γ的最大和值α0;找到最大和值α0对应的训练矢量r0,根据公式:δ=r0TU-1r0计算阈值,如训练矢量大于阈值,则对应像素为异常像素。本专利技术实现过程可包括以下几个阶段:初始化阶段:读取高光谱图像三维数据,将同一位置的所有波段的像素按序排列成一个矢量,即把高光谱图像的每一个像元对应的光谱矢量作为一个矢量数据。根据矢量和值(一范数)将所有矢量按序排列,根据初始码书大小,将排序后的矢量平均分成若干类,取每一类的质心组成初始码书。数据预处理阶段:对初始码书做主成分PCA分析(Principle Component Analysis),得到PCA特征矩阵,通过初始码书和PCA特征矩阵获得码书主成分。具体可采用方法包括:取PCA特征矩阵中的部分分量(如可取前5%),与初始码书相乘,得到码书主成分。异常检测阶段:对PCA特征矩阵进行异常像素检测RXD(Reed-Xiaoli Detection),对矩阵中的每本文档来自技高网
...

【技术保护点】
一种快速压缩高光谱图像的矢量量化方法,其特征在于,读取高光谱图像数据构建初始码书Y,将初始码书做PCA运算,获得PCA特征矩阵U,根据U的分量Ur提取初始码书的主成分得到初始码书主成分YU;在训练矢量中排除异常像素,从排除异常像素的训练矢量中提取训练矢量主成分BU;记录训练矢量主成分对应的关系索引IB;根据初始码书主成分YU对训练矢量主成分BU进行聚类,所有矢量聚类后根据索引IB找到对应训练矢量,利用每个胞腔中找到的训练矢量的质心更新码书,获得最终训练矢量码书,将最终训练矢量码书和训练矢量码字索引进行存储并传输。

【技术特征摘要】
1.一种快速压缩高光谱图像的矢量量化方法,其特征在于,读取高光谱图像数据构建初始码书Y,将初始码书做PCA运算,获得PCA特征矩阵U,根据U的分量Ur提取初始码书的主成分得到初始码书主成分YU;在训练矢量中排除异常像素,从排除异常像素的训练矢量中提取训练矢量主成分BU;记录训练矢量主成分对应的关系索引IB;根据初始码书主成分YU对训练矢量主成分BU进行聚类,所有矢量聚类后根据索引IB找到对应训练矢量,利用每个胞腔中找到的训练矢量的质心更新码书,获得最终训练矢量码书,将最终训练矢量码书和训练矢量码字索引进行存储并传输。2.根据权利要求1所述的方法,其特征在于,构建初始码书Y具体为:读取三维高光谱图像数据,转化为二维矢量数据,将二维矢量数据的所有维度相加得到和值,根据和值将二维矢量数据排序,根据码书大小将排序后的矢量平均分成多份,取每份的质心作为初始码书。3.根据权利要求1所述的方法,其特征在于,根据U的分量Ur提取初始码书的主成分具体包括:将同一波段的数据作为矩阵的相同列元素,矩阵中每一行为一个k维码子;根据码书Y的元素Yjr,j=1,2,…,N,r=1,2,…,k调用公式计算每个波段的样本均值,其中N为码书大小,根据各波段的样本均值和高光谱数据矩阵中各个波段的数据计算任意两个波段的协方差组成协方差矩阵C,根据协方差矩阵C的特征向量大小对C的特征向量排序得PCA特征矩阵,取特征矩阵U中预定分量与初始码书相乘得到初始码书主成分YU。4.根据权利要求1所述的方法,其特征在于,利用改进的RXD算法对训练矢量进行异...

【专利技术属性】
技术研发人员:陈善学王一宁桂成名
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1