一种基于张量分解的多声道音频信号压缩方法技术

技术编号:8453744 阅读:291 留言:0更新日期:2013-03-21 20:32
本发明专利技术公开了一种基于张量分解的多声道音频信号压缩方法,属于音频信号处理技术领域,尤其是空间音频编解码技术领域。将每个声道的音频信号进行交叠分帧,并对每帧信号进行时频变换得到频域系数,将所有声道和所有帧序列的频域系数组合,建立三阶张量信号,并对其进行张量分解得到低秩核张量用于编码传输,解码端结合恢复的低秩核张量和事先训练的低秩投影矩阵进行张量信号重建,对重建后的张量信号再进行每个声道上反变换和交叠相加恢复多声道音频信号。本方法结合时频变换和张量分解对多声道音频信号进行分析和编解码,利用声道间和声道内的相关性去处冗余信息,能较大程度提高多声道音频信号的压缩效率。

【技术实现步骤摘要】

本专利技术涉及一种多声道音频信号压缩方法,尤其是一种基于张量分解的多声道信号压缩方法,属于音频信号处理
,尤其是空间音频编解码

技术介绍
在数字音频应用领域,多声道音频能够提供临场感的环绕声音感受,这是传统立体声信号所不能提供的。随着人们对数字音频信号的高享受的需求,高效的音频信号压缩方法越来越被研究者重视。为了产生空间环绕的效果,多声道信号编解码技术例如DolbyAC-3,DTS以及MPEG Surround等相继被提出,这些方法在编码端大多需要传输由多声道下混后的单声道或立体声信号,并提取空间音频参数一并传输,以便在解码端再上混为多声道信号。随着虚拟现实、3D游戏、高质量视频会议等交互式音频应用的发展,多声道音频信号需要以尽可能低的速率压缩传输,而声道数目的增多(甚至于几百声道)难以有较大程度的压缩效果,如何利用声道间和声道内的相关性进行高效压缩是多声道音频编码领域的关键问题。多声道信号相比传统的单声道和立体声信号研究的影响因素增多,至少涉及声道、时域、频域三种因素,构成一种高阶信号空间,适合用张量结构表示和分析,进而通过构建张量信号利用张量分解方法进行低秩近似本文档来自技高网...

【技术保护点】
一种基于张量分解的多声道音频信号压缩方法,其特征在于,包括以下步骤:步骤一:在编码端,对待处理的声道数目为R的多声道音频信号,首先将每个声道的音频信号采用汉明窗进行分帧,帧长为L,帧移为M,从而把每个声道的音频信号分成N帧,顺序排列后得到每个声道的帧序列;步骤二:对每个声道,对分帧后的每帧音频信号分别进行时频变换,每帧音频信号经过该时频变换后得到长度为S的频域系数;步骤三:对每个声道,将每一帧所对应的长度为S的频域系数作为矩阵的每一行,即将N帧音频信号的频域系数构成一个大小为N×S的系数矩阵;将所有R个声道的系数矩阵进行依次排列,构成大小为R×N×S的三阶张量信号X,所述的三阶分别称为:声道序...

【技术特征摘要】

【专利技术属性】
技术研发人员:王晶谢湘匡镜明
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1