当前位置: 首页 > 专利查询>武汉大学专利>正文

一种结合字典学习和图像分块的感知压缩方法技术

技术编号:17660919 阅读:50 留言:0更新日期:2018-04-08 12:17
本发明专利技术公开了一种结合字典学习和图像分块的感知压缩方法,首先选取训练图像,在确定字典原子个数的情况下训练解析字典。然后再编码端读入待压缩的图像,利用解析字典对图像进行稀疏表示,再根据稀疏系数矩阵中元素的大小选择最优化系数同时将最优化系数的所对应的原子空间提取出来作为当前数据重建端的字典,然后获取系数的标签信息和位置信息,传输到解码端。最后在解码端进行重构,恢复原始图像。本发明专利技术比同类方法,缩短了重构时间,而且提升了重构精度,有较强的实用性。

【技术实现步骤摘要】
一种结合字典学习和图像分块的感知压缩方法
本专利技术属于图像压缩
,涉及一种图像压缩方法,具体涉及一种结合字典学习和图像分块的感知压缩方法。
技术介绍
随着计算机视觉技术的不断发展,图像作为视觉信息的载体受到广大学者的关注。但高分辨率、高光谱影像技术的发展,给图像传输及保存带来了严重的挑战。近年来,压缩感知理论逐渐受到国内外学者的广泛关注,压缩感知理论指出如果图像变换域中是稀疏的或者可压缩的时则信号可以通过少量的观测样本数据通过求解最优化方法实现信号的高精度重构。图像压缩感知模型主要有综合模型和解析模型两种。综合模型将稀疏表示的过程定义为X=DS,s.t.||si||0≤k,其中D为过完备字典,S为图像在当前过完备字典下的稀疏表示系数矩阵,si为图像X中图像局部数据xi所对应的系数向量。求解最优稀疏表示的过程中通过限定S中每个元素si的非零元素个数小于k,以实现在图像在过完备字典D下的k稀疏表示。尽管综合模型稀疏表示已经发展很长时间,但是其仍处于不断发展完善的阶段。另一种模型,解析模型近几年吸引了大量的学者关注,其又被称为共稀疏解析模型(Cosparseanalysismodel)。共稀疏解析模型将稀疏表示的过程定义为S=ΦX,s.t.||si||0≤p-l,其中X为待稀疏表示的图像信号集,Φ为当前的解析字典,S则为图像信号集X在当前解析字典Ω下的稀疏表示系数矩阵,si为稀疏系数矩阵中的列向量,p为si的行数,l为si中零的个数又称为共稀疏度,则通过限定si的l0范数小于p-l从而实现信号的稀疏表示过程。由X=DS,s.t.||si||0≤k和S=ΦX,s.t.||si||0≤p-l可知,当D、Ω同为方阵时,则此刻两者可以实现等价替换Φ=D-1,D-1表示D的伪逆;当D、Φ同为过完备字典时,则D∈Rm×n(m<n),Φ∈Rp×q(p>q)从而两者不再是简单的互逆过程,其两者之间完全不同。由X=DS,s.t.||si||0≤k和S=ΦX,s.t.||si||0≤p-l可知在获得相同维度的稀疏系数矩阵时,解析模型包含更多的子空间数量,有更加丰富灵活的表示性能。同时解析模型稀疏表示的过程通过字典与信号进行矩阵相乘求内积的方式获得,即S=ΦX,s.t.||si||0≤p-l,这样相对综合模型减少了大量的运算过程,从而提高计算效率,因此解析模型在图像的稀疏表示及压缩过程中将更具优势。基于这个原因解析模型在图像处理中越来越受到关注。Rubinstein等在K-SVD字典学习的基础上引入了AnalysisK-SVD解析模型字典学习算法,算法利用稀疏编码和字典更新交替进行的步骤学习解析字典,并验证了算法在图像去噪应用的优势。SimonHawe等将解析字典获取的问题转化为矩阵的流形优化问题,在lp范数最小的求解最优化问题约束条件基础上提出了几何共轭梯度下降法,并通过实验验证了算法在图像处理领域的优势与潜力。有的文献在梯度下降的基础上将稀疏观测行列式的值作为优化条件引入字典学习过程中,在实验基础上验证算法在字典学习的优势。MartinKiechle提出了双峰共稀疏模型,在矩阵流型基础上提出了联合梯度下降方法获取解析字典,同时通过实验验证算法在图像重建的优势。随着研究的不断增加,解析字典学习在图像处理中的优势也越来越突出。综上所述,目前的图像压缩存在以下问题:1.使用固定字典,匹配度低,重构效果较差;2.采用综合模型进行稀疏表示,计算量大,时间和内存消耗大。
技术实现思路
为了解决上述技术问题,本专利技术基于解析模型学习字典在稀疏表示、图像处理中的优势,同时借鉴分块图像处理的优势,提出了一种基于解析字典的分块图像压缩方法,将共稀疏解析模型应用到图像的压缩流程中以提高图像的处理效率和提高图像的重构精度。本专利技术所采用的技术方案是:一种结合字典学习和图像分块的感知压缩方法,其特征在于,包括以下步骤:步骤1:定义S=ΦX,s.t.||Si||0≤p-l;通过限定si的l0范数小于p-l从而实现信号的稀疏表示过程;其中X为待稀疏表示的图像信号集,Φ为当前的解析字典,S则为图像信号集X在当前解析字典Φ下的稀疏表示系数矩阵,si为稀疏系数矩阵中的列向量,p为si的行数,l为si中零的个数又称为共稀疏度;步骤2:对测试图像在解析字典下进行稀疏表示;步骤3:对稀疏系数基于量化熵编码进行压缩编码;步骤4:将编码后的信息传输到解码端。本专利技术是一种应用于图像压缩的方法,与现有的技术相比具有以下优点:(1)本专利技术在分块感知压缩的基础上,从稀疏表示的耗时的角度出发将解析字典学习引入到分块感知压缩流程中。(2)本专利技术基于解析模型下稀疏表示是利用字典与信号的内积来获得的,因此其在计算耗时上要远少于其他模型的稀疏表示耗时,从而可以提高压缩重建的效率。(3)本专利技术采用解析字典属于学习获得使得其在稀疏表示上更优于其他基于变换模型的稀疏表示。附图说明图1是本专利技术实施例的图像压缩模型。图2是本专利技术实施例的压缩重构结果(采样率分别为0.21、0.28),其中(a)、(c)为原始图像数据;(b)、(d)为压缩后重建的图像数据。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种结合字典学习和图像分块的感知压缩方法,包括以下步骤:步骤1:本专利技术实现的前提输入的图像能够对其进行稀疏表示,模型定义为:S=ΦX,s.t.||Si||0≤p-l,其中X为待稀疏表示的图像信号集,Φ为当前的解析字典,S则为图像信号集X在当前解析字典Ω下的稀疏表示系数矩阵,si为稀疏系数矩阵中的列向量,p为si的行数,l为si中零的个数又称为共稀疏度,则通过限定si的l0范数小于p-l从而实现信号的稀疏表示过程;l0为范数,即si中非零元素的个数;其中解析字典的获取包括以下子步骤:步骤1.1:训练解析字典;对训练图像数据进行分块处理,利用大小相等B*B的模板块对图像进行分块,获得分块后的数据XΓ∈Rd×L,其中,d=B*B,L为图像分块后的个数,其值为图像总体大小除以分块大小获得;步骤1.2:用解析字典算法获取所需字典;具体实现包括以下子步骤:步骤1.2.1:初始化参数;迭代次数t=1,最大迭代次数K=50,冗余误差ε,初始化字典Φ0,令Φ1=Φ0;步骤1.2.2:计算数据在当前字典下的稀疏表示系数:St=ΦtXΓSt表示S的转置,Φt表示Φ的转置;步骤1.2.3:利用MOD算法获取字典:Φt+1←Φt;步骤1.2.4:计算误差因子值r=||S-ΦX||2+||Φ-1Φ-I||2,Φ-1表示Φ的伪逆,I表示单位矩阵;步骤1.2.5:判断;若r≥ε且迭代次数t≤K,则t=t+1,并回转执行步骤1.2.2-步骤1.2.4;否则结束迭代过程;步骤1.2.6:获得最终的解析字典Φ=Φt。步骤2:对测试图像在解析字典下进行稀疏表示;步骤3:对稀疏系数基于量化熵编码进行压缩编码;具体实现包括以下子步骤:步骤3.1:对测试图像数据进行分块处理,利用大小相等B*B的模板块对图像进行分块,获得分块后的数据其中,d=B*B,L1为图像分块后的个数,其值为图像总体本文档来自技高网
...
一种结合字典学习和图像分块的感知压缩方法

【技术保护点】
一种结合字典学习和图像分块的感知压缩方法,其特征在于,包括以下步骤:步骤1:定义S=ΦX,s.t.||Si||0≤p‑l;通过限定si的l0范数小于p‑l从而实现信号的稀疏表示过程;其中X为待稀疏表示的图像信号集,Φ为当前的解析字典,S则为图像信号集X在当前解析字典Φ下的稀疏表示系数矩阵,si为稀疏系数矩阵中的列向量,p为si的行数,l为si中零的个数又称为共稀疏度;l0为范数,即si中非零元素的个数;步骤2:对测试图像在解析字典下进行稀疏表示;步骤3:对稀疏系数基于量化熵编码进行压缩编码;步骤4:将编码后的信息传输到解码端。

【技术特征摘要】
1.一种结合字典学习和图像分块的感知压缩方法,其特征在于,包括以下步骤:步骤1:定义S=ΦX,s.t.||Si||0≤p-l;通过限定si的l0范数小于p-l从而实现信号的稀疏表示过程;其中X为待稀疏表示的图像信号集,Φ为当前的解析字典,S则为图像信号集X在当前解析字典Φ下的稀疏表示系数矩阵,si为稀疏系数矩阵中的列向量,p为si的行数,l为si中零的个数又称为共稀疏度;l0为范数,即si中非零元素的个数;步骤2:对测试图像在解析字典下进行稀疏表示;步骤3:对稀疏系数基于量化熵编码进行压缩编码;步骤4:将编码后的信息传输到解码端。2.根据权利要求1所述的结合字典学习和图像分块的感知压缩方法,其特征在于,步骤1中解析字典的获取包括以下子步骤:步骤1.1:训练解析字典;对训练图像数据进行分块处理,利用大小相等B*B的模板块对图像进行分块,获得分块后的数据XΓ∈Rd×L,其中,d=B*B,L为图像分块后的个数,其值为图像总体大小除以分块大小获得;步骤1.2:用解析字典算法获取所需字典。3.根据权利要求2所述的结合字典学习和图像分块的感知压缩方法,其特征在于,步骤1.2的具体实现包括以下子步骤:步骤1.2.1:初始化参数;迭代次数t=1,最大迭代次数K=50,冗余误差ε,初始化字典Φ0,令Φ1=Φ0;步骤1.2.2:计算数据在当前字典下的稀疏表示系数:St=ΦtXΓ;St表...

【专利技术属性】
技术研发人员:种衍文潘少明冯宗伟郑炜玲李红
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1