当前位置: 首页 > 专利查询>西华大学专利>正文

一种基于叠加序列的语音信号压缩存储与重构方法技术

技术编号:19697511 阅读:30 留言:0更新日期:2018-12-08 12:39
本发明专利技术公开了一种基于叠加序列的语音信号压缩存储与重构的方法,包括:读取稀疏语音信号,利用非零元素和零元素位置索引构建原始索引序列,存储稀疏语音信号的稀疏度;对稀疏语音信号进行压缩处理,生成压缩信号序列;截取原始索引序列的部分序列作为索引序列,经过编码、转化、扩频等处理生成扩频索引序列;将扩频索引序列与压缩信号序列分别加权、叠加后生成存储序列进行存储;对存储序列做解扩处理,得到转化索引序列和压缩信号序列;将转化索引序列经过数据还原、解码,还原出索引序列;根据索引序列构造支撑集合,并重构出稀疏语音信号。本发明专利技术优点在于:在不增加存储资源的情况下,有效提高语音信号的重构精度。

【技术实现步骤摘要】
一种基于叠加序列的语音信号压缩存储与重构方法
本专利技术涉及语音信号的压缩存储与重构
,特别涉及一种基于叠加序列的语音信号压缩存储与重构方法。
技术介绍
随着日益频繁的信息交互,语音信号是信息交互中非常常见的一种信号,其处理技术要求也日渐精进。由于语音信号本身的多样性以及人类听觉系统的独特性,使得语音信号在不同的变换域下是稀疏的。传统的语音信号采样通常需要满足奈奎斯特采样速率。压缩感知理论(Compressedsensing,CS),指出具有稀疏性或可压缩性的信号可以通过压缩感知技术进行压缩采样与重构。因此将CS理论与语音信号处理领域相结合将降低采样频率、降低对采样器件的要求。根据CS理论,将稀疏语音信号通过观测矩阵进行压缩,再利用重构算法重构出稀疏语音信号。然而,现有的重构算法如匹配追踪算法、正交匹配追踪算法、压缩采样匹配追踪算法、基追踪算法、子空间追踪算法等等,均不是专门针对稀疏语音信号的重构而提出的,继而没有考虑和利用稀疏语音信号的元素位置索引,使稀疏语音信号的重构精度受到限制。
技术实现思路
本专利技术针对现有技术的缺陷,提供了一种基于叠加序列的语音信号压缩存储与重构方法。相比于传统的压缩感知语音压缩,本专利技术利用稀疏语音信号的元素的部分位置索引辅助重构,在不增加存储成本的情况下,提高语音信号的重构精度。为了实现以上专利技术目的,本专利技术采取的技术方案如下:一种基于叠加序列的语音信号压缩存储与重构方法,包括以下步骤:(a)语音信号的压缩存储处理:(a1)读取稀疏化后稀疏度为K,长度为N的语音信号x,用0,1元素构建长度为N的“原始索引序列”记录语音信号中非零元素和零元素位置索引,同时存储稀疏语音信号的稀疏度K;(a2)读取预先存储的M×N的测量矩阵Φ,并利用测量矩阵对语音信号进行压缩处理,生成长度为M的“压缩信号序列”y,所述的压缩处理表示为y=Φx;所述的测量矩阵诸如高斯随机矩阵、贝努利随机矩阵和部分哈达玛矩阵等已有的测量矩阵;所述M,N通常满足M≤N;(a3)对长度为N的“原始索引序列”进行截取,得到长度为βN的“索引序列”A,所述截取系数β根据工程经验设定,且满足0<β≤1;(a4)根据霍夫曼编码,对长度为βN的“索引序列”A做压缩编码处理,生成长度为L1的“压缩索引序列”B,再经数据转化处理后,得到长度为L2的“转化索引序列”C;(a5)对长度为L2的“转化索引序列”C作扩频处理,并利用“添零”方式,构造长度为M的“扩频索引序列”(a6)对长度同为M的“扩频索引序列”和“压缩信号序列”y分别赋予权值α和1-α后进行叠加,利用公式生成长度为M的“存储序列”z,并对“存储序列”z进行存储;所述权值α根据工程经验设定,且满足0≤α≤1。(b)语音信号的重构再现处理:(b1)对长度为M的存储序列z做解扩处理,还原出长度为L2“转化索引序列”C;(b2)对长度为L2“转化索引序列”C进行扩频处理,并利用“添零”方式,构造出长度为M的“扩频索引序列”(b3)利用公式求出长度为M的“压缩信号序列”y;(b4)对长度为L2的“转化索引序列”C进行数据还原,还原出长度为L1的“压缩索引序列”B,再经霍夫曼解码,解码还原出长度为βN的“索引序列”A;(b5)将长度为βN的“索引序列”A中非零元素的列序号记录在集合中,构成“固定支撑集合”(b6)利用“固定支撑集合”辅助,并结合重构算法从长度为M的“压缩信号序列”y中重构出长度为N的稀疏语音信号x。进一步的,步骤a1)所述的稀疏语音信号是指离散语音信号经过时频变换方法从时域信号变换为频域信号,并根据“心理声学模型”将低于静音门限的信号幅度置为零,得到长度为N的稀疏语音信号x。所述的“心理声学模型”诸如MPEG(MovingPictureExpertsGroup)心理声学模型和OGG(OGGVobis)心理声学模型。所述的时频变换方法可采用诸如离散余弦变换、短时傅里叶变换、小波变换。进一步的,步骤a1)所述的用0,1元素构建长度为N的“原始索引序列”记录语音信号中非零元素和零元素位置索引的过程为:长度为N的稀疏语音信号x中的零元素在“原始索引序列”中对应记录为元素0,非零元素在“原始索引序列”中对应记录为元素1,如此构建的“原始索引序列”为一个长度为N且元素为0或1的序列进一步的,步骤a4)所述的数据转化过程为:将长度为L1的“压缩索引序列”B的数据以γ个数据为一组,分为L2组,若序列Β的数据个数不能被γ整除,则用“添零”方式构造出能被γ整除的序列;将每组数据从二进制数转化为一个十进制实数值,从而实现转化处理,得到长度为L2的“转化索引序列”C。进一步的,步骤a5)所述的利用长度为L2的“量化索引序列”C通过扩频和添零的方式构造长度为M的“扩频索引序列”的具体步骤如下:a5-1)“转化索引序列”假设Q∈Rq×1为扩频序列,其中q是扩频增益,满足其中,扩频序列Q可取为m序列,M序列,Gold序列,Zadoff-chu序列。其中,符号表示向下取整数操作。a5-2)计算Kronecker积,实现序列C的扩频展开,即S长度为(L2×q);其中,上标“T”表示求转置操作。a5-3)在矢量S末尾添加零,使其长度从(L2×q)增加到M,从而构造出“扩频索引序列”度为M。进一步的,步骤b2)所述的利用长度为L2的“量化索引序列”C通过扩频和添零的方式构造长度为M的“扩频索引序列”的具体步骤与步骤a5-1)至步骤a5-3)一致。进一步的,步骤b4)所述的数据还原过程为:将长度为L2的“转化索引序列”C中实数元素转化为二进制数,从转化得到的二进制数的尾部去掉幅度值为零的元素,使剩余元素的长度为L1,剩余元素组成的序列即为“压缩索引序列”B。进一步的,步骤b6)所述的利用“固定支撑集合”辅助是指,在结合重构算法进行重构的过程中,每次对支撑集合更新迭代时,都保留“固定支撑集合”辅助重构。所述的重构方法诸如匹配追踪算法、正交匹配追踪算法和正则正交匹配追踪算法。进一步的,以重构算法正交匹配追踪算法为例,步骤b6)包括:b6-1)读取“压缩信号序列”y∈RM×1,测量矩阵Φ∈RM×N,稀疏度K,t表示迭代次数,rt表示t次迭代的残差,Ωt表示t次迭代的索引(列序号)集合,即t次迭代的支撑集合,Kt表示索引集合Ωt的元素个数,表示Kt×1向量,λt表示第t次迭代找到的索引(列序号),aj表示矩阵Φ的第j列(j=1,2,…,N),表示按“固定支撑集合”选出的矩阵Φ的列集合,Φt表示按索引集合Ωt选出的矩阵Φ的列集合(大小为M×Kt的矩阵),符号∪表示集合并运算,|·|表示求绝对值,<X,Y>表示求向量X,Y的内积,||·||表示求向量的算子2范数,(·)-1表示矩阵求逆;b6-2)初始化b6-3)如果Kt<K,求解找到索引λt;否则,求的最小二乘解:执行步骤b6-8);b6-4)令Ωt=Ωt-1∪{λt},b6-5)求的最小二乘解:b6-6)更新残差b6-7)t=t+1,返回步骤b6-3);b6-8)稀疏语音信号在支撑集合Ωt索引处有非零项,其值为所求的最小二乘解将在支撑集合Ωt索引之外的元素置0重构出稀疏语音信号x。与现有技术相比本专利技术的优点在于:在不增加存储成本本文档来自技高网...

【技术保护点】
1.一种基于叠加序列的语音信号压缩存储与重构方法,其特征在于,包括以下步骤:(a)语音信号的压缩存储处理:(a1)读取稀疏化后稀疏度为K,长度为N的语音信号x,用0,1元素构建长度为N的“原始索引序列”

【技术特征摘要】
1.一种基于叠加序列的语音信号压缩存储与重构方法,其特征在于,包括以下步骤:(a)语音信号的压缩存储处理:(a1)读取稀疏化后稀疏度为K,长度为N的语音信号x,用0,1元素构建长度为N的“原始索引序列”记录语音信号中非零元素和零元素位置索引,同时存储稀疏语音信号的稀疏度K;(a2)读取预先存储的M×N的测量矩阵Φ,并利用测量矩阵对语音信号进行压缩处理,生成长度为M的“压缩信号序列”y,所述的压缩处理表示为y=Φx;所述M,N通常满足M≤N;(a3)对长度为N的“原始索引序列”进行截取,得到长度为βN的“索引序列”A,所述截取系数β根据工程经验设定,且满足0<β≤1;(a4)根据霍夫曼编码,对长度为βN的“索引序列”A做压缩编码处理,生成长度为L1的“压缩索引序列”B,再经数据转化处理后,得到长度为L2的“转化索引序列”C;(a5)对长度为L2的“转化索引序列”C作扩频处理,并利用“添零”方式,构造长度为M的“扩频索引序列”(a6)对长度同为M的“扩频索引序列”和“压缩信号序列”y分别赋予权值α和1-α后进行叠加,利用公式生成长度为M的“存储序列”z,并对“存储序列”z进行存储;所述权值α根据工程经验设定,且满足0≤α≤1;(b)语音信号的重构再现处理:(b1)对长度为M的存储序列z做解扩处理,还原出长度为L2“转化索引序列”C;(b2)对长度为L2“转化索引序列”C进行扩频处理,并利用“添零”方式,构造出长度为M的“扩频索引序列”(b3)利用公式求出长度为M的“压缩信号序列”y;(b4)对长度为L2的“转化索引序列”C进行数据还原,还原出长度为L1的“压缩索引序列”B,再经霍夫曼解码,解码还原出长度为βN的“索引序列”A;(b5)将长度为βN的“索引序列”A中非零元素的列序号记录在集合中,构成“固定支撑集合”(b6)利用“固定支撑集合”辅助,并结合重构算法从长度为M的“压缩信号序列”y中重构出长度为N稀疏语音信号x。2.根据权利要求1所述的方法,其特征在于:步骤a1)所述的稀疏语音信号是指离散语音信号经过时频变换方法从时域信号变换为频域信号,并根据“心理声...

【专利技术属性】
技术研发人员:卿朝进万东琴阳庆瑶王维郭奕
申请(专利权)人:西华大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1