【技术实现步骤摘要】
基于双重稀疏模型解码的压缩感知视频传输方法及系统
本专利技术涉及数字图像及信号处理领域,尤其涉及基于双重稀疏模型解码的压缩感知视频传输方法及系统。
技术介绍
压缩感知理论通过利用信号的稀疏特性,在远小于Nyquist采样率的条件下,随机采样获取信号的离散样本,然后通过非线性算法重建信号。其核心思想是若信号在某个变换基Ψ上是稀疏的,编码端用一个与Ψ不相关的测量矩阵Φ将信号投影到一个低维空间,解码端通过求解最优化问题即可从少量投影中精确重构原始信号。分布式视频编码系统,可使视频序列的帧间相关性用于解码端,实现用边信息结合解码算法解码,而编码端仅需实现分布式帧内编码,从而使编码端复杂度大大降低。它与传统视频编码技术的差别在于:传统技术通常都会在编码端充分挖掘视频序列的冗余信息,编码端复杂度一般较高;而分布式视频编码具有编码器复杂度低、容错性好、编码端耗电量低等特点。传统视频压缩通常是非线性编码、线性解码,这使得编码复杂度非常高,系统编码端压力大,通过结合压缩感知理论与分布式视频编码的思想,可以把系统复杂度转移至解码端,而在解码端寻找高效高性能的解码算法,这非常适用于系统 ...
【技术保护点】
一种基于双重稀疏模型解码的压缩感知视频传输方法,其特征在于,包括如下编码步骤和解码步骤,所述编码步骤包括:视频帧图像分组步骤:提取视频序列帧图像,形成视频图像帧组;压缩编码步骤:分别对关键帧与非关键帧进行基于压缩感知的线性压缩,获取相应的压缩结果并传输给解码单元,所述关键帧用k帧表示,所述非关键帧用cs帧表示;在所述解码步骤中包括:关键帧重构步骤:关键帧压缩结果到达解码单元后,由GPSR算法进行重构;边信息生成步骤:由相邻的前后两个关键帧的重构结果,采用运动估计补偿算法生成边信息;冗余字典构造步骤:字典训练过程将利用到前后相邻已重构关键帧与边信息帧,模块的输入为待训练图像集 ...
【技术特征摘要】
1.一种基于双重稀疏模型解码的压缩感知视频传输方法,其特征在于,包括如下编码步骤和解码步骤,所述编码步骤包括:视频帧图像分组步骤:提取视频序列帧图像,形成视频图像帧组;压缩编码步骤:分别对关键帧与非关键帧进行基于压缩感知的线性压缩,获取相应的压缩结果并传输给解码单元,所述关键帧用k帧表示,所述非关键帧用cs帧表示;在所述解码步骤中包括:关键帧重构步骤:关键帧压缩结果到达解码单元后,由GPSR算法进行重构;边信息生成步骤:由相邻的前后两个关键帧的重构结果,采用运动估计补偿算法生成边信息;冗余字典构造步骤:字典训练过程将利用到前后相邻已重构关键帧与边信息帧,模块的输入为待训练图像集{k(t-1)帧、k(t+1)帧、SI帧}及以下参数:小波变换滤波器系数,分解级数l,各子字典原子大小db,以下为字典训练步骤:a.将训练集图像输入字典构造模块,所述训练集图像包括已重构关键帧、边信息,模对每个训练图像做l级小波变换,提取各自的系数子带;b.生成训练样本集:对各子带方向小波系数提取不重叠的块并排成向量,构成该子带训练样本集,初始化所有子字典Db,初始化过程同时利用OMP算法获得初始的稀疏表示系数矩阵A;c.通过K-SVD算法训练各自子带方向的字典,获得训练后的字典同时得到相应稀疏表示系数矩阵Ab;d.利用训练集与稀疏表示系数,得到重组形成的完整字典并输出;非关键帧重构步骤:利用非关键帧压缩结果,以及上述字典训练步骤d中输出的字典,通过GPSR算法,完成非关键帧的重构;视频帧图像重组步骤:由已解码的帧组图像重组形成解码后的视频序列。2.根据权利要求1所述的压缩感知视频传输方法,其特征在于,在所述视频分组步骤中,从输入的视频序列中提取出视频帧图像并形成GOP帧组,帧组中第一帧图像为关键帧,其余若干帧图像为非关键帧;各组内帧图像将按关键帧、非关键帧的顺序进行传输;在所述压缩编码步骤中,首先将像素点个数为N的二维图像帧信号按列输出为N×1的一维信号xt,然后分别对帧组中k帧与cs帧通过压缩感知yt=Φxt压缩过程,获取相应帧图像的压缩结果yt,yt是Mt×1维的向量,Φ是Mt×N维的压缩矩阵,这里k帧的压缩率MRk大于或等于cs帧的压缩率MRcs,用以为cs帧提供估计信息,其中xt的压缩率MR被定义为MRt=Mt/N;其中压缩矩阵Φ=QMWPN,WB表示B×B的哈德玛矩阵,PN表示对W的列向量进行随机排序,QM表示随机抽取WPN中的M行。3.根据权利要求2所述的压缩感知视频传输方法,其特征在于,在所述关键帧重构步骤中,获取k帧压缩结果后,将其结合GPSR梯度投影凸优化算法解决算式完成重构;其中yt是Mt×1维的压缩结果,yt=Φxt,Θ=ΦΨ是大小为M×N的矩阵,Φ是Mt×N维的压缩矩阵,Ψ是稀疏基矩阵,τ是正值的拉格朗日乘子,st是待优化的估计系数,表示求该式的二范数的平方,||.||1表示求该式的一范数;求解出该算式的最优解估计值后,原关键帧信号重构估计值为在所述边信息生成步骤中,cs帧相邻前后的两个k帧,将采用MCI双向运动估计补偿算法,以GOP=2为例,将视频帧图像分成若干个块,Mn为cs帧中的某一像块,Mn-1和Mn+1分别为k(t-1)帧和k(t+1)帧的同位置像块;首先以k(t+1)为参考帧,搜索与Mn-1最佳匹配的像块,得到了运动矢量(i,j);然后以(i/2,j/2)作为Mn的运动矢量,对Mn进行前向运动估计补偿,得到预测结果Xn;同理,再以k(t-1)帧为参考帧,搜索与Mn+1最佳匹配的像块,得到运动矢量(i’,j’),然后以(i’/2,j’/2)作为Mn的运动矢量,以k(t-1)帧为参考帧,对Mn进行后向运动补偿,得到Yn,最后,再将Xn和Yn进行平均,即可得到Mn的运动补偿内插值,遍历所有的像块后,获得两个双向的预测结果Xt与Yt,对他们进行求均值的操作,即生成了当前帧的边信息SIt。4.根据权利要求3所述的压缩感知视频传输方法,其特征在于,在所述步骤a中:依据双稀疏字典表示模型,字典训练问题可描述为:其中,Y表示待训练集,A表示稀疏表示系数矩阵,αi代表矩阵A的第i列,K为稀疏度,EZ表示字典的每个原子可由核心字典E稀疏表示,即D=EZ,Z为稀疏表示矩阵,表示矩阵的F范数,将上式变形等价为其中Ea代表小波变换基,表示对训练集图像做l级的离散小波变换,通过若干次离散低通和离散高通迭代分解,能够得到b=3l+1个系数子带,它们分别代表了不同方向尺度的分量,提取这b=3l+1个子带,每个不同子带的集合将形成字典训练样本集;在所述步骤b中:从步骤a得到的各系数子带中提取Qb个块,每个子带集合被分成若干不重叠的块,将它们展开成列向量并依次排列最终形成各自的训练集(EaY)b;初始化所有子字典Db,b=1,2,…,3l+1,同时对各子带训练集通过OMP算法求稀疏表示系数矩阵Ab;在所述步骤C中:对每个子带训练集使用K-SVD算法训练字典,解决算式其中ai,b表示矩阵Ab的第i列,经过不断的迭代得到优化解,每一次迭代更新字典的某项原子,直到满足迭代终止条件迭代结束,最终获得各自子带方向的其中结合了OMP算法得到相应的稀疏表示系数Ab;OMP算法过程为:初始化残差赋值r←(EaY)b,索引值集合赋值Ik←Ab,迭代次数t=1,残差小于阈值m时,寻找最大内积所对应的索引值i;扩充索引值集合:Ik←Ik∪{i};更新残差和迭代次数:t=t+1;当残差大过阈值,迭代终止,输出稀疏表示系数Ab与各子带字典在所述步骤d中:各子带字典依据小波变换的原始系数矩阵排布结构,将各子带字典通过重新排列形成训练后的系数字典Dl,再利用初始训练集Y与重组后的稀疏表示系数矩阵Al,通过解决算式得到重组形成的完整小波域多尺度字典输出5.根据权利要求4所述的压缩感知视频传输方法,其特征在于,在所述非关键帧重构步骤中,接收到非关键帧压缩结果,结合步骤d中训练的冗余字典通过GPSR算法完成对cs帧的重构,主要解决算式:其中s是当前cs帧的压缩结果,Φ是Mt×N维的压缩矩阵。6.一种基...
【专利技术属性】
技术研发人员:吴绍华,赵睿思,王海旭,焦健,张钦宇,
申请(专利权)人:哈尔滨工业大学深圳研究生院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。