利用改进的脉冲再同步化的似ACELP隐藏中的自适应码本的改进隐藏的装置及方法制造方法及图纸

技术编号:13104239 阅读:63 留言:0更新日期:2016-03-31 11:08
提供一种用于重建包括语音信号的帧作为重建帧的装置,所述重建帧与一个或多个可用帧相关联,所述一个或多个可用帧是重建帧的一个或多个先前帧以及重建帧的一个或多个后续帧中的至少一个,其中一个或多个可用帧包括作为一个或多个可用音调周期的一个或多个音调周期。装置包括用于确定指示一个或多个可用音调周期中的一个的样本数量与待被重建的第一音调周期的样本数量之间的差的样本数量差的确定单元(210)。此外,装置包括用于通过依据样本数量差以及依据一个或多个可用音调周期中的一个的样本重建待被重建作为第一重建音调周期的第一音调周期而重建所述重建帧的帧重建器(220)。帧重建器(220)用于重建所述重建帧,以使得重建帧完全地或部分地包括第一重建音调周期,以使得重建帧完全地或部分地包括第二重建音调周期,以及以使得第一重建音调周期的样本数量不同于第二重建音调周期的样本数量。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术设及音频信号处理,特别是语音处理,并且更特别地设及用于似AC化P(似 代数码激励线性预测)隐藏中的自适应码本的改进隐藏的装置W及方法。
技术介绍
音频信号处理变得越来越重要。在音频信号处理领域中,隐藏技术扮演重要角色。 当帖丢失或损坏时,由于丢失或损坏的帖而丢失的信息必须被放回。在语音信号处理中,尤 其是,当考虑到ACELP或似ACELP语音编解码器时,音调信息是非常重要的。音调预测技术W 及脉冲再同步化技术是所需的。 关于音调重建,现有技术中存在不同的音调外推技术。 运些技术中的一种是基于重复的技术。多数的现有编解码器应用基于简单重复的 隐藏方法,运意味着在包丢失之前最后正确地接收的音调周期被重复,直至良好的帖到达 且可从比特流中解码出新的音调信息为止。或者,应用音调稳定性逻辑,根据其,选择在包 丢失之前已被接收一些时间的音调值。遵循基于重复的方法的编解码器是,例如,G.719(参 看)、G.729(参看)、AMR(参看,)、AMR-WB(参看)W及AMR-WB+(ACELP及TCX20(似AC化P)隐藏)(参看 ); (AMR=自适应多速率;AMR-WB =自适应多速率宽带)。)^及6.722附录4(参 看)。 现有技术的又一种音调重建技术是基于外推。一些现有的编解码器应用音调外推 方法并且执行特定算法W在包丢失时依据外推的音调估计而改变音调。运些方法将参照 G. 718 W及G. 729.1在下面更详细地说明。 首先,G.718被考虑(参看)。未来音调的估计通过外推被进行W支持声口 脉冲再同步化模块。运个可能的未来音调值的信息用于同步化隐藏的激励的声口脉冲。 仅当最后的良好帖不是无声的时进行音调外推。G.718的音调外推是基于编码器 具有平滑的音调轮廓的假设。所述外推基于消音之前的最后屯个子帖的音调滞后而被 进行。 在G.718中,浮动音调值的历史更新在每个正确地接收的帖之后被进行。为了运个 目的,仅当核屯、模式不是无声的时更新音调值。在丢失帖的情况中,浮动音调滞后之间的差 根据公式(1)被计算:/研' £ 二二....L …,.(i (1)在公式(1)中,表示先前帖的最后(即,第4个)子帖的音调滞后;表示先前 帖的第3个子帖的音调滞后;等等。[001引根据G.718,差值省的总和如公式(2)被计算: (2) 由于值苗I可W是正数或负数,述I.的符号反向的数量被相加并且通过存储器中 保存的参数指示第一反向的位置。[001引通过公式(3 )得到参数f cnrr :其中dmax = 231是考虑的音调滞后的最大值。 在G.718中,根据W下限定得到指示最大绝对差值的位置imax: 并且如下所示计算对于运个最大差值的比率: (4) 如果运个比率大于或等于5,则最后正确接收的帖的第4个子帖的音调被用于待隐 藏的所有子帖。如果运个比率大于或等于5,运意味着所述算法是不够可靠的W外推所述音 调,并且所述声口脉冲再同步化将不会被进行。 如果rmax小于5,则另外的处理被进行W实现最佳可能外推。Ξ种不同的方法被用 于外推未来音调。为了在可能的音调外推算法之间做选择,计算偏差参数其取决于因 子fcDrrW及最大音调变化的位置imax。但是,首先,修改平均浮动音调差值W从平均值中移 除太大的音调差值: 如果心^0.98且如果imax=3,则根据公式(5)确定平均部分音调差值S部i 巧 W移除关于两个帖之间的过渡的音调差值。 如果心口>〇.98或如果1。3、辛3,则根据公式(6)计算平均部分音调差值^娜.,[002引 ㈱ 并且最大浮动音调差值被运个新的平均值替代:口) 使用运个浮动音调差值的新平均值,如下计算标准偏差 (8) 其中Isf在第一情况中等于4,在第二情况中等于6。 依据运个新参数,在外推未来音调的Ξ种方法之间做选择: 如果改变符号多于两次(运指示高的音调变化),第一符号反向在最后的良好 帖中(对于i<3),并且fc。rr2〉0.945,则如下计算外推的音调dext(外推的音调也被表示为 Text): 如果0.945<fcnrr2<0.99并且改变符号至少一次,则采用部分音调差值的加权平 均值外推音调。平均差值的权重fw与标准偏差fcorr2有关,并且如下所示定义第一符号反向 的位置:[003引 公式中的参数imem取决于的第一符号反向的位置,W使得如果第一符号反向发 生在过去帖的最后两个子帖之间则ime" = 0,使得如果第一符号反向发生在过去帖的第2个 及第3个子帖之间则imem= 1,W此类推。如果第一符号反向接近于最后帖结束,运意味着音 调变化仅在丢失帖之前不太稳定。因此应用至平均值的加权因子将是接近于0并且外推的 音调dext将是接近于最后良好帖的第4个子帖的音调: 否则,音调演变被考虑是稳定的并且如下所示确定外推音调dext: 在运个处理之后,音调滞后被限制在34W及231之间(值指示最小W及最大允许的 首调滞后)。 现在,为说明基于外推的音调重建技术的另一示例,G. 729.1被考虑(参看 )〇)。例如,如果两个连续帖丢失(一个超级帖由四个帖组成,可W是 ACELP或TCX20),则运种情况出现。也有可能是TCX40或TCX80帖及其几乎所有组合。 当在有声区域中丢失一个或多个帖时,先前的音调信息通常被用于重建当前丢失 的帖。当前估计的音调的精确性可能直接地影响与原始信号对齐的相位,并且其对于当前 丢失的帖W及在丢失帖之后接收到的帖的重建质量是关键的。使用多个过去的音调之后而 不是仅复制先前的音调滞后将导致统计上较佳的音调估计。在G. 729.1编码器中,用于FEC (前向误差校正)的音调外推由基于过去五个音调值的线性外推组成。过去五个音调值是P 。),对于1 = 〇,1,2,3,4,其中?(4)是最近的音调值。根据公式(9)定义外推模型: p'(i)=a+i.b (9) 然后,如公式(10)被定义对于丢失帖中的第一子帖的外推音调数值: p'(5)=a+5.b (10) 为了确定系数aW及b,误差E被最小化,其中根据公式(11)定义误差E: 下面,对如中所提出的用于AMR-WB编解码器的现有帖删除隐藏概念进行 说明。运个帖删除隐藏概念是基于音调和增益线性预测。所述文章提出基于最小均方误差 准则,在帖丢失情况中的线性音调内推/外推法。 根据运个帖删除隐藏概念,在解码器侧,当删除帖之前的最后有效帖(过去帖)的 类型与删除帖之后的最先帖(未来帖)的类型相同时,定义音调P(i),其中i = -N,-N+l,…, 0,1,···,N+4,N+5,并且其中N是删除帖的过去W及未来子帖的数量。P(l),P(2),P(3),P(4) 是删除帖中的四个子帖的四个音调,P(0),P(-1),…,P(-N)是过去子帖的音调,并且P(5),P (6),···,Ρ(Ν+5)是未来子帖的音调。线性预测模型P'(i)=a+b· i被采用。对于i = l,2,3,4; P'(1),P'(2),P'(3),P'(4)是对于删除帖的预测音调。MMS准则(MMS =最小均方)被考虑W 根据内推方法而推导出两个预测系数aW及b的值。根据运种方法,误差E被定义为:[005引本文档来自技高网...

【技术保护点】
一种用于重建包括语音信号的帧作为重建帧的装置,所述重建帧与一个或多个可用帧相关联,所述一个或多个可用帧是所述重建帧的一个或多个先前帧以及所述重建帧的一个或多个后续帧中的至少一个,其中所述一个或多个可用帧包括作为一个或多个可用音调周期的一个或多个音调周期,其中所述装置包括:确定单元(210),用于确定样本数量差所述样本数量差指示所述一个或多个可用音调周期中的一个的样本数量与待被重建的第一音调周期的样本数量之间的差,以及帧重建器(220),用于通过依据所述样本数量差以及依据所述一个或多个可用音调周期中的一个的样本重建待被重建作为第一重建音调周期的所述第一音调周期,而重建所述重建帧,其中所述帧重建器(220)用于重建所述重建帧,以使得所述重建帧完全地或部分地包括所述第一重建音调周期,以使得所述重建帧完全地或部分地包括第二重建音调周期,以及以使得所述第一重建音调周期的样本数量不同于所述第二重建音调周期的样本数量。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:杰雷米·勒孔特迈克尔·施那拜尔戈兰·马尔科维奇马丁·迪茨伯恩哈德·诺伊格鲍尔
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1