用于搜索固定码本的方法和设备技术

技术编号:3044580 阅读:163 留言:0更新日期:2012-04-11 18:40
提供一种用于搜索固定码本的方法和设备,所述方法和设备用于搜索包括对话音信号的预定分量进行建模的脉冲的码本。所述方法包括以下操作:从与分配给至少一个分支的预定脉冲位置集合的脉冲位置相应的路径中,选择与最符合预定分量的预定数量的脉冲位置相应的预定数量的路径,其中,所述分支将预定网格结构的一个状态连接到其它状态,对除了所述一个状态之外的状态中的每一个执行上述路径选择操作,并且从包括选择的路径的路径中,选择与最符合预定分量的脉冲位置相应的路径。因此,减少在码本搜索期间需要的计算量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于搜索码本的方法和设备,更具体地说,涉及一种用 于搜索包括脉沖的码本的方法和设备,其中,所述脉冲对包括在话音信号中 的预定分量进行建模。
技术介绍
在信息技术的应用领域(诸如,移动和卫星通信、多媒体通信、个人便 携式通信和互联网电话),使用压缩/解压缩技术对语音信号进行编码的语音编码器(vocoder)技术非常重要。存在各种类型的语音编码器。基于分析合 成(analysis-by-synthesis)结构的码激励线性预测(CELP)编码在多媒体和 无线通信系统中使用得最普遍。在CELP编码中,通过自适应码本和固定码 本对声道的剩余信号和声门的特征进行建模。根据码本的结构及其搜索处理, 在不同程度的复杂性下实现CELP编码,并且CELP编码提供不同质量的合 成声音。因此,已经提出各种CELP编码的实现和它们的变型。作为CELP的示例,存在代数CELP (ACELP)编码方法,用于使用简 单的代数方法来获得代码矢量。ACELP编码方法基于包括每个帧的若干幅度 (+1/-1 )的脉冲的组合的代数符号结构,并使用码本中有限多种幅度的脉冲。 因此,ACELP编码方法应对信道噪声表现得非常强健。使用ACELP编码方 法搜索代码矢量的方法称为固定码本搜索。自适应多速率(AMR)宽带话音编码器被选择作为称为第三代合作伙伴 计划(3GPP)的国际协会中的宽带话音编码器标准,其具有9种固定比特率 的传输模式,即,23.85kbps、 23.05kbps、 19.85kbps、 18.25kbps、 15.85kbps、 14.25kbps、 12.65kbps、 8.85kbps和6.60kbps。固定码本搜索基于代数码本结 构,并根据不同的传输模式而按照不同的方式来实现。图1是示出应用于AMR宽带话音编码器的8.85kbps模式的固定码本搜 索方法的流程图。图1的固定码本搜索方法基于代数码本。使目标信号的MES 最小化的固定码本^与使等式1最大化的固定码本相同<formula>formula see original document page 7</formula>其中,(f指示目标信号与脉沖响应h(n)之间的相关性,(D指示脉冲响应 h(n)的相关性。当每个子帧包括M个样本时,分别通过等式2和等式3来计 算d(n)和O)(i,j):<formula>formula see original document page 7</formula>( 2 )<formula>formula see original document page 7</formula> ( 3 )AMR宽带话音编码器的8.85kbps模式的代数码本具有表1所示的结构。 如表1所示,对于总共4个音轨(track)中的每一个,搜索一个脉冲,总共 20个比特被分配给找到的脉冲的位置和符号,从而找到的脉冲被编码。[表l]<table>table see original document page 7</column></row><table>现将参照表1来描述图1的固定码本搜索方法。固定码本q仅包括四个非0的矢量,^v而可进行快速码本搜索。分别在等式4和等式5中表示等式 1的分子的相关性及其分母的能量<formula>formula see original document page 7</formula> …(4)其中,mi指示第i个脉沖的位置,Si指示第i个脉沖的符号,Np指示脉 冲的数量。<formula>formula see original document page 7</formula> …(5)参照图1,在操作ll,预先计算等式4和等式5,从而可进行快速码本 搜索。此外,通过等式6来计算当选择用于减少计算量的脉沖候选矢量时使 用的^直b(n):<formula>formula see original document page 7</formula>…(6)其中,^指示相关性d(n)的能量,& 指示基音预测之后产生的剩余信号,A指示剩余信号,W的能量。在操作12,使用先前在操作11计算的值b(n)来选择用于第一和第三音轨的脉冲位置的候选矢量。在操作13的子操作13a、 13b和13c,从使用矢量候选所属的音轨t以及 紧接着音轨t的音轨(t+1)的两个重叠的环路搜索使等式1的值最大化的两 个脉冲的最佳位置。利用找到的两个固定的脉沖,从使用矢量候选所属的音 轨(t+2)以及紧接着音轨(t+2)的音轨(t+3)的两个重叠的环路搜索使等 式1的值最大化的另两个脉沖的最佳位置。在操作13的子操作13d到13f中, 子操作13a到13c被重复4次,并且从子操作13a到13c的4次执行的结果 确定使等式1的值最大化的最后4个最佳脉沖位置和最佳脉冲符号。如上所 述,按照如下方式来实现图1的固定码本搜索方法根据相关值从音轨的脉 沖选^若干候选脉冲,然后搜索下一音轨。因此,图1的固定码本搜索方法 与同时搜索所有音轨的方法相比,所包括的计算量减少。然而,考虑通过图 1的固定码本搜索方法产生的声音的质量,则所包括的计算相当大。
技术实现思路
技术方案本专利技术提供一种与传统的码本搜索方法相比,包括减少计算量并产生改 进质量的声音的码本搜索方法,以及执行码本搜索方法的码本搜索设备。本专利技术还提供一种记录用于执行码本搜索方法的计算机程序的计算机可 读记录介质。有益效果根据本专利技术,使用向每个分支分配预定的脉冲位置集的网格结构来选择 与最符合话音信号的预定分量的脉冲位置相应的路径,从而减少在码本搜索 期间必需的计算量。此外,通过将网格结构的最后一个状态和初始状态的数 量限制到预定数量来进一步减少在码本搜索期间必需的计算量。此外,网格结构的使用使得能够使用结构比现有代数码本扩展的码本, 从而即使不增加计算量也能够实现提供改进质量的声音的码本搜索。具体说 来,不同于现有代数码本中的从专有脉沖位置被分配到的每个音轨搜索脉冲, 而是按照多个集合(每个集合均具有专有脉冲位置)的并集的形式从每个音 轨搜索脉冲,从而可实现提供改进质量的声音的码本搜索。此外,使用预定脉冲位置集合被分配给每个分支的网格结构,并且对于网格结构的阶(stage)被组合的阶组中的每个选择与脉冲位置的组合相应的 路径。因此,在码本搜索期间需要的计算量被减少,由于考虑到脉冲之间的 影响可实现提供改进质量的声音的码本搜索。附图说明图1是示出应用于AMR宽带话音编码器的8.85kbps模式的固定码本搜 索方法的流程图;图2示出当块约束网格编码量化(BC-TCQ, block constrained Trellis coded quantization)算法应用于4状态网格结构时考虑的网格路径;图3示出当在图2的4状态网格结构中使用代数网格编码(ATC)算法 时的编码处理;图4是根据本专利技术实施例的码本搜索设备的框图;图5是根据本专利技术实施例的码本解码设备的框图;图6示出在网格结构的预定阶执本文档来自技高网
...

【技术保护点】
一种搜索包括对话音信号的预定分量进行建模的脉冲的码本的方法,所述方法包括以下操作:    (a)从与分配给至少一个分支的预定脉冲位置集合的脉冲位置相应的路径中,选择与最符合预定分量的预定数量的脉冲位置相应的预定数量的路径,其中,所述分支将预定网格结构的一个状态连接到其它状态;    (b)对除了所述一个状态之外的状态中的每一个执行操作(a);以及    (c)从包括在操作(a)和(b)中选择的路径的路径中,选择与最符合预定分量的脉冲位置相应的路径。

【技术特征摘要】
【国外来华专利技术】KR 2005-7-13 10-2005-0063267;KR 2006-7-11 10-2006-1、一种搜索包括对话音信号的预定分量进行建模的脉冲的码本的方法,所述方法包括以下操作(a)从与分配给至少一个分支的预定脉冲位置集合的脉冲位置相应的路径中,选择与最符合预定分量的预定数量的脉冲位置相应的预定数量的路径,其中,所述分支将预定网格结构的一个状态连接到其它状态;(b)对除了所述一个状态之外的状态中的每一个执行操作(a);以及(c)从包括在操作(a)和(b)中选择的路径的路径中,选择与最符合预定分量的脉冲位置相应的路径。2、 如权利要求l所述的方法,其中执行操作(a)和(b)的状态属于网格结构的一个阶; 所述方法还包括操作(d),对除了所述一个阶之外的阶执行操作(a) 和(b);并且操作(c)包括从包括在操作(a)、 (b)和(d)中选择的路径的路径 中选择与最符合预定分量的脉冲位置相应的路径。3、 如权利要求l所述的方法,其中,所述预定分量是通过使用线性预测 编码方法并从话音信号去除基音分量来对话音信号进行过滤而获得的信号。4、 如权利要求2所述的方法,其中,操作(d)包括按照从第一阶到最 后一阶的顺序对网格结构的阶执行操作(a)和(b)。5、 如权利要求2所述的方法,其中,构建网格结构,从而使不同的脉沖 位置集合被分配给阶,分配给一个阶的脉沖位置集合被划分成的脉冲位置集 合被分配给所述一个阶的分支,分配给另一阶的脉沖位置集合被划分成的脉 冲位置集合被分配给所述另一阶的分支。6、 如权利要求5所述的方法,其中,分配给阶的脉冲位置集合中的至少 一个是多个均具有专有脉冲位置的集合的并集。7、 如权利要求2所述的方法,还包括以下操作将网格结构的初始状态 的数量限制为第 一数量,并将与限制的初始状态相应的最后 一个状态的数量 限制为第二数量。8、 如权利要求7所述的方法,其中操作(d)包括在序列中对网格结构的第一阶到第预定编号的阶执行操作(a)和(b);所述方法还包括以下操作(e) 基于在操作(a)、 (b)和(d)中选择的路径,通过跟踪开始于所 述第预定编号的阶的状态之一的路径来确定与所述第预定编号的阶的所述状 态之一相应的初始状态,并确定从所述第预定编号的阶的所述一个状态到最 后 一个状态的路径,最后一个状态的数量受限于第二数量;(f) 对除了所述第预定编号的阶的所述一个状态之外的所述第预定编号 的阶的状态中的每一个执行操作(e);以及(g) 对在操作(e)和(f)确定的路径上的状态执行操作(a)和(b);并且操作(c)包括从包括在操作(a)、 (b)、 (d)和(g)中选择的路径的 路径中选择与最符合预定分量的脉沖位置相应的路径。9、 如权利要求8所述的方法,其中网格结构包括N ( =2V,其中,v指示整数)个状态和L个阶; 第一数量为2W ((Kw《v),第二数量为2v—w;并且 第预定编号的阶为第丄-log2 TV阶。10、 一种搜索包括对话音信号的预定分量进行建模的脉冲的码本的方法, 所述方法包括以下操作(a )从与分配给多个分支的预定脉沖位置集合的脉冲位置组合相应的路 径中,选择与最符合预定分量的脉冲位置组合相应的路径,其中,所述分支 将网格结构的阶组之一 的最后 一 阶的 一个状态连接到所述一个阶组的第 一 阶 的状态,通过按照预定数量组合网格结构的阶来获得阶组;(b )对除了最后一阶的所述一个状态之外的状态中的每一个执行操作 (a); (c)对除了所述一个阶组之外的阶组执行操作(a)和(b)...

【专利技术属性】
技术研发人员:成昊相李康殷姜尚远托马斯R费什全仔镜
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1