差错隐藏装置以及差错隐藏方法制造方法及图纸

技术编号:3505574 阅读:148 留言:0更新日期:2012-04-11 18:40
因为以往的差错隐藏处理生成变化剧烈的声响,会使人感到极为不快,另外回声效应(echo  effect)以及“咔嗒”噪声(click  noise)也十分明显。在本发明专利技术中,通知信号检测单元(301)对输入帧的处理进行判断。当为差错帧时,语音检测单元(303)对之前的非差错数据的帧进行是否为语音信号的判断。当为语音帧时,语音复制处理单元(304)生成替换帧。当为非语音帧时,暂态信号(transient  signal)检测单元(305)通过暂态信号检测来判断是否为攻击信号(attack  signal),并且从之前的非差错帧中选择一个适当的区域。滤波器组分析单元(306)生成N个子带。这些子带通过外插处理单元(307)被进行子带取样外插,成为对当前的差错帧的替换子带数据。滤波器组合成单元(308)根据该数据重新构筑子带数据。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及在发送、播发以及存储媒体中的隐藏损失或者破损的数字信号(差错)的技术。
技术介绍
在发送信息的分组或者帧时,无论通过有线还是无线的方法,这些分组的一部分都有发生损失或者破损的可能性。即使将带宽增强、将网络或传输技术进行改良,类似这样的损失都不能完全避免。语音分组或者音频分组发生损失或者破损时,结果会导致人耳可以听到的非自然信号(artfact)、音频质量恶化,导致变成人耳不能分辨的音频内容。类似这样的恶化,在流的实时播放中或在传输中会特别给人带来不愉快的感觉。为了将这样的恶化限制到最小的限度,差错隐藏处理进行应运而生。该处理的基本的想法是将差错数据用一部分的合成数据或者生成数据进行替换。差错隐藏的目的顾名思义在发送、接收、存储、编码处理或者解码处理中,因为数据损失或者数据破损而产生差错,为了隐藏这些差错,也就是将这些差错掩盖起来,最好使差错不被识别出来、或者至少使差错不那么明显。将语音数据以及音频数据作为对象的差错隐藏存在多种方式和技术。既有发送端支援型的,也有接收端基础型的。发送端支援型的方法为发送端将损失或者破损的信息再次发送,或者在发送信息中嵌入纠错信息以便使损失数据得以恢复。接收端基础型的方法则在进行损失数据的隐藏处理时,不需要来自发送端的信息。这是要将损失或者破损的数据替换成有益的信息,由此来发挥作用,因此该信息通常是对损失或者破损的部分的推定。这些替换数据不需发送端的支援而在接收端生成。接收端基础型的差错隐藏处理有各种各样的技术。简单的方法有噪声抑制(muting)和数据复制(data repetition)。噪声抑制只是单纯地将差错数据替换成与该差错数据同样时间长的无声或零值。另一方面,数据复制只是单纯地将差错数据替换成最新的非差错数据。如果使用数据插值技术(譬如非专利文献1),能够得到比上述的简单方法更佳的结果。该方法通过从差错数据相邻的非差错数据进行插值,来试图重新构成替换数据。而且还有更加复杂的方法。该方法为编解码器相关型(codec dependent),针对特殊类型的语音或音频的编解码器对该方法执行了最优化。这是利用用来导出编解码器参数的音频压缩算法的知识,来再次生成用来替换损失数据的数据的方法。图1为表示将噪声抑制、复制以及插值的各种差错隐藏处理组合在一起的差错隐藏技术的步骤的流程图。一旦接收了音频数据的帧,就在ST101检查该帧是否为差错帧。当该帧不为差错帧时,在ST102将接收数据存储于存储器,以便过后在ST107的插值处理中使用。接收帧当在ST101被作为差错帧而检测出来时,在ST103以及ST105进行一系列的确定,如果系统内还允许迟延的话,基于以前的或者过后的非差错帧,对当前的差错帧适用哪种差错隐藏技术为最佳来作出判断。在ST103进行检查,来判断对当前的差错帧进行噪声抑制是否恰当。当噪声抑制被选择时,在ST104当前的差错帧被替换成零数据帧。也就是,当前的差错帧被替换成无声。当噪声抑制对该差错帧不恰当时,在ST105进行检查,来判断能否对该帧执行插值。譬如,在突发差错不适于插值或没有缓冲过后的数据的迟延的情形下,在ST106最后的非差错帧被反复在当前的差错帧中。在ST105插值被选择时,使用在ST102被存储的数据,在ST107执行插值处理。I.Kauppinen等人的著书「Audio Signal Extrapolation-Theory and Applications」Proc.of 5th Int.Conf.on Digital Audio Effect、2000年9月
技术实现思路
专利技术需要解决的问题发送端基础型的差错隐藏方式存在以下问题再次发送成为导致更长延迟的原因,而且用来恢复差错的嵌入信息使传输开销增加。这些状态不适于实时的通信或者传输系统等的应用。接收端基础型虽然不需要重发或来自发送端的追加信息,但是存在增加接收端的计算处理的负担的问题。这两种方法都有各自不同的缺点。但是,一般来说,因为接收端终端具备足够的能力可以对应,所以计算处理的增加通常是微不足道的。还有一个优点就是,因为不存在重发的迟延以及开销,更加适合用于实时系统。但是,上述的技术所示的简单的接收端基础型的差错隐藏技术不能得到优质的差错隐藏结果。噪声抑制存在接收信号突然消失,而该结果会产生声音电平的急剧变动的问题。使用噪声抑制时如果发生突发差错,会导致长时间的无声状态。而且此时接收了固定的差错时,还会导致发出“急拉的噪声”(jerky)。数据重复或者复制存在导致回声效应的问题。该效应在存在长时间的突发差错时会减退。另外,不考虑相邻帧之间的信号特性而只是替换帧的话,会出现界线不连续的问题,发生刺耳的“咔嗒”声、非自然信号的问题。但是,该方法对单一的帧差错来讲,比起噪声抑制可以得到略好的隐藏结果。但是,对于突发差错来讲依然无能为力。插值存在源于界线不连续的问题而发生“咔嗒”声、非自然信号的问题。对单一的帧差错来讲,隐藏的质量比起噪声抑制以及复制时具有优势,但是对突发差错来讲其质量则大幅度地减退。这些技术虽然简单而且容易加以执行,但却不能等到令人满意的隐藏结果。编解码器相关方式虽然能够得到出色的结果,但却称不上具有足够的通用性。通常可以使用该方法的只限于特定的应用或者特定的语音或音频编解码器。通过预测用于特定的编解码器的参数,多种编解码器相关方式能够在压缩域(compressed domain)发挥功效。通常类似这样的方式需要更高的计算处理成本。因此,本专利技术旨在提供一种语音信号或音频信号的差错隐藏技术,而尽可能地抑制差错隐藏所产生的影响。解决该问题的方案本专利技术利用不同特性来分类语音数据或者音频数据,并提供恰当的方式来生成用来隐藏差错数据的替换数据。图2表示本专利技术涉及的差错隐藏装置的主要结构。语音数据或者音频数据可以经由各种各样的媒体来提供,譬如从存储媒体(或经由或者有线或无线网络的传输系统)200来接收。这些数据汇集于帧或分组中,通常采用压缩形式。当分组被接收后,使用适当的语音或音频解码器250,将分组解码成适于重放的非压缩的音频形式的帧。在所有的阶段进行检验,确认接收的分组是否存在损失或者破损,以及在接收分组的解码过程中是否发生差错。无论在哪个阶段发生了差错,差错隐藏处理单元300都会被通知,以便隐藏差错帧。本专利技术涉及的差错隐藏处理单元300的内部结构如图3的方框图所示。对所有的帧,都有用来通知的信号被发出,以便通知其为差错帧还是为非差错帧。通知信号检测单元301检测该信号,并对输入数据的帧判断应该采取什么处理。当帧为非差错帧时,该帧被存储于采样存储单元302,相同数据的帧被输出以备重放或存储。存储的数据在语音检测单元303、暂态信号检测单元305以及外插处理单元307,当过后发生差错时被使用。当为差错帧时,语音检测单元303对之前的非差错数据的帧执行判断,判断其为语音信号还是非语音信号。当为语音帧时,语音复制处理单元304被使用,通过音调计算以及复制,用来隐藏差错帧的替换帧被生成出来。当为非语音帧时,在暂态信号检测单元305,执行暂态信号的检测处理,判断其是否为攻击信号。继而,暂态信号检测单元305,为滤波器组分析单元306,从之前的非差错帧中选择恰当的区域(以下称本文档来自技高网
...

【技术保护点】
一种差错隐藏装置,包括:检测单元,在差错帧发生时检测出该差错帧之前的非差错帧;判断单元,判断检测出的非差错帧为语音帧还是音频帧;替换语音帧生成单元,从判断为语音帧的非差错帧,通过适于语音帧的处理来生成所述差错帧的替换帧;替换音频帧生成单元,从判断为音频帧的非差错帧,通过适于音频帧的处理来生成所述差错帧的替换帧;以及,替换单元,将通过所述替换语音帧生成单元或所述替换音频帧生成单元所生成的替换帧与所述差错帧进行替换来隐藏所述差错帧。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:后藤道代张峻伟梁世丰吉田幸司
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利