一种低比特率音乐信号编码方法技术

技术编号:3420527 阅读:192 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种低比特率音乐信号编码方法,包括以下步骤:1)将音乐信号分帧,并对每帧信号加窗,建立谐波模型,选定表征该模型的各个参数;2)依据所述参数的先验概率分布及初始值,并结合该模型的条件概率分布,应用贝叶斯估计方法,得到所述各参数的后验分布;3)根据得到的后验分布,采用可逆跳转蒙特卡罗采样算法,循环迭代直至算法达到收敛,获取各参数的估计值;4)将得到的各参数估计值送入编码器,完成对音频信号的低码率编码。该方法能较好地拟合音乐信号,获得表征音乐信号的参数,然后对参数进行低码率编码。

【技术实现步骤摘要】

本专利技术涉及,尤其涉及采用贝叶斯估计的低比特率音乐信号编码。
技术介绍
世界正迈进数字化、网络化、全球一体化的信息时代。信息技术正逐步渗透到人类社会的方方面面,人们对信息的提供和传输质量提出了更高的要求。由于存储媒体容量和传输带宽的限制,必须运用各种压缩技术来传输数据。声音是一种重要的传输信息媒体,目前数字音频领域的音频编码技术主要有 1)无损压缩 音频压缩技术的发展最初是从无损压缩开始的,典型的压缩方法是PCM(脉冲编码调制)。PCM虽然能较好地还原音质,但它的瞬时压扩技术和块压扩(Block-Compressing)技术的编码效率较低,码率太高。随着数字信号处理技术的发展,随后出现了一系列频域编码算法,即感知编码算法。 2)音频感知编码 音频感知编码的目标是尽可能地减少音频原始信号和编解码信号之间的感知失真,同时尽可能地减少比特率进行编码。对于音乐信号,目前大多集中在对时频表示信号的系数进行变换编码。典型的变换编码如MPEG-4的AAC(Advanced Audio Coder)编码,对大约64kbit/s单音信号能提供非常清晰的质量,但在低比特率下可能会产生一些人为噪声。 3)参数编码 相对于感知编码,参数音频编码的思路是将音频信号按照更加自适应的方式进行分解。不同的成分用不同的信源模型表示,每个模型都定义自己的参数集以描述不同的属性。分解完成之后,需要将参数分别量化、编码并传送到解码端。例如MPEG-4的SSC(Sinusoidal Coding)参数编码就是基于这种方式,在24kbit/s时编码质量比AAC好,但它不适合更低的码率。 在很多场合下,例如网络带宽较低或存储介质的容量很低的情况下,上述编码方法的码率过高。这就需要一项既能保证较好音质,并且码率很低的技术。
技术实现思路
本专利技术要解决的技术问题是提供一种低比特率的音乐编码方法,该方法能较好地拟合音乐信号,获得表征音乐信号的参数,然后对参数进行低码率编码。 为了解决上述问题,本专利技术提供了,包括以下步骤 1)将音乐信号分帧,并对每帧信号加窗,建立谐波模型,选定表征该模型的各个参数; 2)依据所述参数的先验概率分布及初始值,并结合该模型的条件概率分布,应用贝叶斯估计方法,得到所述各参数的后验分布; 3)根据得到的后验分布,采用可逆跳转蒙特卡罗采样算法,循环迭代直至算法达到收敛,获取各参数的估计值; 4)将得到的各参数估计值送入编码器,完成对音频信号的低码率编码; 进一步的,本专利技术所述的方法,其中,步骤(1)中,所述建立谐波模型,包括将每一帧音乐信号,分解为由幅度不同的各次正弦谐波和高斯白噪声的叠加; 进一步的,本专利技术所述的方法,其中,步骤(1)中,所述表征谐波模型的参数,包括谐波数、基音频率、各次谐波的幅度、以及噪声方差; 进一步的,本专利技术所述的方法,其中,步骤(2)中,所述参数的先验概率分布分别被设定为噪声方差服从倒伽马分布,谐波数服从泊松分布,基音频率服从均值分布,幅度服从高斯分布; 进一步的,本专利技术所述的方法,其中,所述步骤(2)中,包括应用贝叶斯估计方法所得到的各参数的后验概率分布,正比于其先验概率分布与描述其条件概率分布的似然函数的乘积; 进一步的,本专利技术所述的方法,其中,步骤(3)中,所述可逆跳转蒙特卡罗采样算法,包括 i)确定各参数的初始值,并以一定的概率选择运动方式类型; ii)由先验分布产生建议值,并开始由1到L循环计算准许率k,若准许率k大于1,则新的各参数预测值就是其建议值;若准许率k小于1,则以准许率k的概率将建议值赋给新的预测值,否则新的预测值为前一迭代时刻的值; iii)循环迭代直至算法达到收敛,返回L个预测值; 进一步的,本专利技术所述的方法,其中,步骤(i)中,所述运动方式类型,包括谐波数增加、减少、不变三种类型; 进一步的,本专利技术所述的方法,其中,步骤(ii)中,若准许率k小于1,则以准许率k的概率计算各参数的建议值,包括 对于谐波数增加的类型,根据可逆跳转蒙特卡罗采样算法,计算准许率gbirth,判定谐波数和基频的预测值的取值,并产生其余参数的建议值; 对于谐波数减少的类型,根据可逆跳转蒙特卡罗采样算法,计算准许率gdeath,判定谐波数和基频的预测值的取值,并产生其余参数的建议值; 对于谐波数减少的类型,根据可逆跳转蒙特卡罗采样算法,计算准许率gupdate,判定基频的预测值的取值,并产生其余参数的建议值; 本专利技术所述的方法,其中,所述步骤(3)中,进一步包括根据得到的后验分布,采用可逆跳转蒙特卡罗采样算法,循环迭代直至算法达到收敛后,每个参数均得到一个含有个L个元素的预测值数列,然后选择估计准则,分别对每个参数的预测值数列进行处理,即得到了每个参数的一个估计值; 进一步的,本专利技术所述的方法,其中,所述估计准则,包括最大后验概率估计、后验均值估计、以及最小均方误差估计; 进一步的,本专利技术所述的方法,其中,步骤(3)中,所述编码器采用以下方法进行编码,包括差分编码方法、霍夫曼编码方法。 与现有技术相比,本专利技术所述方法,能较好地拟合音乐信号,获得表征音乐信号的参数,然后对参数进行低码率编码。 附图说明 图1是本专利技术实施例中采用贝叶斯估计方法的低比特率音乐信号编码方法流程图; 图2是本专利技术实施例中采用贝叶斯估计方法的低比特率音乐信号编码系统结构图; 图3是本专利技术实施例中可逆跳转蒙特卡罗采样算法流程图; 图4是本专利技术实施例中对多帧信号加窗平滑的操作示意图。 具体实施例方式 本专利技术为了解决传统技术方案存在的弊端,通过以下具体实施例进一步阐述本专利技术所述的,以下对具体实施方式进行详细描述,但不作为对本专利技术的限定。 本专利技术的关键是在音乐信号模型的基础上,获得表征音乐信号的参数。音乐信号在频域具有明显的结构特点在频域上,音乐信号由两层模型构成首先,每个音符由基音频率(fundamental frequency)即音节和各次谐波(partials)组成,谐波的时变幅度反映了音乐信号的音色,它们的频率近似地为基频的整数倍数;然后,各个音符同时演奏形成了和弦,即多音信号(polyphony)。针对这一特点,本专利技术采用了一种谐波模型,它将音乐信号看作是一系列正弦谐波和高斯白噪声的叠加,然后,本专利技术采用贝叶斯估计的方法来获取这些参数。贝叶斯估计方法为动态系统的估计问题提供了一类严谨的解决框架,它利用已知的信息建立系统的概率密度函数,即先验分布,再根据条件分布,则能得到未知变量或参数的后验分布,用后验分布来逼近参数的真实分布。本专利技术在谐波模型基础上,根据贝叶斯估计方法,用后验分布来逼近模型各参数的真实分布,然后采用可逆跳转蒙特卡罗采样(RJMCMC,Reverse-Jump Markov Chain Monte Carlo)算法,循环迭代直到算法达到收敛,获得了参数估计值。最后,对参数估计值进行编码,即实现了音乐信号的低比特率编码。 如图1所示,是本专利技术实施例中采用贝叶斯估计方法的低比特率音乐信号编码方法流程图,包括以下步骤 步骤100,将音乐信号划分成短时帧; 步骤101,将每帧信号用谐本文档来自技高网
...

【技术保护点】
一种低比特率音乐信号编码方法,其特征在于,包括以下步骤:    1)将音乐信号分帧,并对每帧信号加窗,建立谐波模型,选定表征该模型的各个参数;    2)依据所述参数的先验概率分布及初始值,并结合该模型的条件概率分布,应用贝叶斯估计方法,得到所述各参数的后验分布;    3)根据得到的后验分布,采用可逆跳转蒙特卡罗采样算法,循环迭代直至算法达到收敛,获取各参数的估计值;    4)将得到的各参数估计值送入编码器,完成对音频信号的低码率编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:王晖颜靖华李传珍蔡娟娟张勤
申请(专利权)人:中国传媒大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利