【技术实现步骤摘要】
本专利技术涉及一种多声道音频信号压缩方法,尤其是一种基于张量分解的多声道信号压缩方法,属于音频信号处理
,尤其是空间音频编解码
技术介绍
在数字音频应用领域,多声道音频能够提供临场感的环绕声音感受,这是传统立体声信号所不能提供的。随着人们对数字音频信号的高享受的需求,高效的音频信号压缩方法越来越被研究者重视。为了产生空间环绕的效果,多声道信号编解码技术例如DolbyAC-3,DTS以及MPEG Surround等相继被提出,这些方法在编码端大多需要传输由多声道下混后的单声道或立体声信号,并提取空间音频参数一并传输,以便在解码端再上混为多声道信号。随着虚拟现实、3D游戏、高质量视频会议等交互式音频应用的发展,多声道音频信号需要以尽可能低的速率压缩传输,而声道数目的增多(甚至于几百声道)难以有较大程度的压缩效果,如何利用声道间和声道内的相关性进行高效压缩是多声道音频编码领域的关键问题。多声道信号相比传统的单声道和立体声信号研究的影响因素增多,至少涉及声道、时域、频域三种因素,构成一种高阶信号空间,适合用张量结构表示和分析,进而通过构建张量信号利用张量 ...
【技术保护点】
一种基于张量分解的多声道音频信号压缩方法,其特征在于,包括以下步骤:步骤一:在编码端,对待处理的声道数目为R的多声道音频信号,首先将每个声道的音频信号采用汉明窗进行分帧,帧长为L,帧移为M,从而把每个声道的音频信号分成N帧,顺序排列后得到每个声道的帧序列;步骤二:对每个声道,对分帧后的每帧音频信号分别进行时频变换,每帧音频信号经过该时频变换后得到长度为S的频域系数;步骤三:对每个声道,将每一帧所对应的长度为S的频域系数作为矩阵的每一行,即将N帧音频信号的频域系数构成一个大小为N×S的系数矩阵;将所有R个声道的系数矩阵进行依次排列,构成大小为R×N×S的三阶张量信号X,所述的 ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。