【技术实现步骤摘要】
【国外来华专利技术】使用用于增强隐藏的参数对音频内容进行编码和解码的编码器、解码器和方法
本专利技术涉及使用编码器和解码器的音频编解码器,其中有缺陷(例如,丢失、损坏或延迟)的音频帧通过使用错误隐藏机制被至少部分地重建。本专利技术通过在比特流内提供所选择的错误隐藏辅助参数来改进传统的错误隐藏机制,该错误隐藏辅助参数增强了解码器侧的隐藏。
技术介绍
在VoIP系统中,分组到达具有不同的延迟或者甚至在接收器处交换的时间顺序。由于预期每个分组在确定的周期性时间点用于在语音/音频解码器处进行解码,所以需要所谓的去抖动缓冲器来消除时间抖动并且如果可能的话恢复分组之间的正确顺序。去抖动缓冲器的可用性使得能够使用信道感知编码,其中当前帧的部分冗余副本在编码器内被编码在未来帧的主副本之上。如果当前帧在接收器处丢失或到达太晚,则在后面的帧中到达的其部分冗余副本可以用于合成丢失的帧。取决于实际的可用系统延迟和帧错误率(FER)(即,当前信道条件),可以在编码器处动态地控制主帧和其部分冗余副本之间的延迟(或帧数)(即,所谓的FEC偏移)以及对是否需要发送特定帧的部分冗余副本的决定。尽管这种技术需要降低主帧的总体大小以保持比特率不变,但是在中等FER和高FER下,与基于非信道感知/冗余的方法相比,它允许更好的质量。诸如互联网之类的网络除了发送数据之外还被用于诸如召开会议之类的VolP通信。因此,将多个语音或音乐编码为数字数据,对数据进行分组排列,并且通过网络将分组发送给接收者。VolP要求该过程实时发生。允许实时使用的协议的缺点是它们不可靠,因为它们允许分组丢失,而不对其进行取回。当这种情况发生时, ...
【技术保护点】
一种用于对类语音内容和/或一般音频内容(2)进行编码的编码器(1),其中,所述编码器(1)被配置为至少在一些帧(8)中将参数(6)嵌入比特流(5)中,所述参数(6)在原始帧(4)丢失、损坏或延迟的情况下增强隐藏。
【技术特征摘要】
【国外来华专利技术】2014.08.27 EP 14182553.9;2015.04.17 EP 15164126.31.一种用于对类语音内容和/或一般音频内容(2)进行编码的编码器(1),其中,所述编码器(1)被配置为至少在一些帧(8)中将参数(6)嵌入比特流(5)中,所述参数(6)在原始帧(4)丢失、损坏或延迟的情况下增强隐藏。2.根据权利要求1所述的编码器,其中,所述编码器(1)被配置为创建主帧(4)和部分副本(8),其中所述部分副本(8)不是所述主帧(4)的低比特率版本,但是所述部分副本(8)包含所述参数(6)。3.根据权利要求1或2所述的编码器,其中,所述编码器(1)被配置为将所述参数(6)延迟一段时间,并且将所述参数(6)嵌入分组(9)中,其中所述分组(9)被编码且在时间上稍后被发送。4.根据权利要求1至3中任一项所述的编码器,其中,所述编码器(1)被配置为减小主帧比特率,其中所述主帧比特率减小和部分副本帧编码机制一起确定要包括在恒定的总比特率内的所述主帧(4)和所述部分副本帧(8)之间的比特率分配。5.根据权利要求2至4中任一项所述的编码器,其中,所述编码器(1)被配置为创建具有所述类语音内容类型和所述一般音频内容类型中的一种类型的主帧(4)以及具有所述类语音内容类型和所述一般音频内容类型中的另一种类型的部分副本(8)。6.根据前述权利要求中任一项所述的编码器,其中,所述编码器(1)是使用TCX编码方案的编解码器的一部分。7.根据权利要求6所述的编码器,其中,所述编码器(1)被配置为检测所述帧是否包含噪声音频信号,或者所述帧是否包含具有在一段时间内平稳的尖锐谱线的噪声基底,并基于所述检测将所述参数(6)嵌入TCX帧中。8.根据权利要求6或7所述的编码器,其中,所述参数(6)包括ISF或LSF参数,具体是预测编码的ISF或LSF参数。9.根据权利要求6至8中任一项所述的编码器,其中,所述参数(6)包括信号分类参数。10.根据权利要求6至9中任一项所述的编码器,其中,所述参数(6)包括TCX全局增益或TCX全局等级。11.根据权利要求6至10中任一项所述的编码器,其中,所述参数(6)包括窗口信息和频谱峰值位置中的至少一个。12.根据权利要求1至5所述的编码器,其中,所述编码器(1)是切换式编解码器的一部分,其中所述切换式编解码器包括至少两个核心编码方案,其中第一核心编码方案使用ACELP,第二核心编码方案使用TCX。13.根据权利要求12所述的编码器,其中,所述编码器(1)被配置为当在ACELP帧之后存在第一TCX帧时,在切换之后不将部分副本(8)放置在TCX帧(4)之上。14.根据权利要求6至13中任一项所述的编码器,其中,所述编码器(1)被配置为在编码之前分析所述信号,并且基于所分析的信号禁用所述部分副本或者提供减小的部分副本(8)。15.根据权利要求1至14所述的编码器,其中,所述编码器(1)被配置为在使用不同量的信息和/或不同参数集(6)的多个部分副本模式之间进行选择,其中所述部分副本模式的选择基于参数。16.根据权利要求15所述的编码器,其中,所述多个部分副本模式中的至少一个是频域隐藏模式。17.根据权利要求15所述的编码器,其中,所述多个部分副本模式中的至少两个是不同的时域隐藏模式。18.根据权利要求17所述的编码器,其中,如果帧包含瞬态或如果帧的全局增益低于先前帧的全局增益,则选择所述至少两个时域隐藏模式中的一个。19.根据权利要求1至18中任一项所述的编码器,其中,所述编码器(1)被配置为在存在LTP数据的情况下发送LTP滞后。20.根据权利要求1至19中任一项所述的编码器,其中,所述编码器(1)被配置为发送分类器信息。21.根据权利要求1至20中任一项所述的编码器,其中,所述编码器(1)被配置为发送LPC参数、LTP增益、噪声等级和脉冲位置中的至少一个。22.一种用于对类语音内容和/或一般音频内容(2)进行解码的解码器(31),其中,所述解码器(31)被配置为在原始帧(4)丢失、损坏或延迟的情况下使用在时间上稍后发送的参数(6)以增强隐藏。23.根据权利要求22所述的解码器,其中,所述解码器(31)被配置为接收主帧(4)和部分副本(8),其中所述部分副本(8)不是所述主帧(4)的低比特率版本,但是所述部分副本(8)包含所述参数(6)。24.根据权利要求22或23之一所述的解码器(31),其中所述参数(6)包含在部分副本(8)中,并且其中所述解码器(31)被配置为在当前丢失帧(4b)的部分副本(8b)可用的情况下从去抖动缓冲器接收该部分副本。25.根据权利要求22至24中任一项所述的解码器,其中,所述解码器(31)被配置为接收具有所述类语音内容类型和所述一般音频内容类型中的一种类型的主帧(4)以及具有所述类语音内容类型和所述一般音频内容类型中的另一种类型的部分副本(8)。26.根据权利要求22至25中任一项所述的解码器,其中,所述解码器(31)是使用TCX编解码方案的编解码器的一部分。27.根据权利要求26所述的解码器,其中,所述参数(6)包括ISF或LSF参数,具体是预测编码的ISF或LSF参数。28.根据权利要求26或27之一所述的解码器,其中,所述参数(6)包括信号分类参数。29.根据权利要求26至28中任一项所述的解码器,其中,所述参数(6)包括TCX全局增益或TCX全局等级。30.根据权利要求26至29中任一项所述的解码器,其中,所述参数(6)包括窗口信息和频谱峰值位置中的至少一个。31.根据权利要求22至25中任一项所述的解码器,其中,所述解码器(31)是切换式编解码器的一部分,其中所述切换式编解码器包括至少两个核心编码方案,其中第一核心编码方案使用ACELP,第二核心编码方案使用TCX。32.根据权利要求31所述的解码器,其中,所述解码器(31)被配置为在ACELP帧之后的第一TCX帧对于所述解码器(31)不可用的情况下,在切换之后使用ACELP隐藏。33.根据权利要求22至32所述的解码器,其中,所述解码器(31)被配置为在使用不同量的信息和/或不同参数集(6)的多个部分副本模式之间进行选择。34.根据权利要求33所述的解码器,其中,所述多个部分副本模式中的至少一个是频域隐藏模式。35.根据权利要求33所述的解码器,其中,所述多个部分副本模式中的至少两个是不同的时域隐藏模式。36.根据权利要求22至35中任一项所述的解码器,其中,所述解码器(31)被配置为在存在LTP数据的情况下接收LTP滞后。37.根据权利要求22至36中任一项所述的解码器,其中,所述解码器(31)被配置为接收分类器信息。38.根据权利要求22至37中任一项所述的解码器,其中,所述解码器(31)被配置为接收LPC参数、LTP增益、噪声等级和脉冲位置中的至少一个。39.根据权利要求22至38中任一项所述的解码器,其中,所述解码器(31)被配置为根据隐藏模式以两个不同因子减少音调增益和代码增益。40.根据权利要求39所述的解码器,其中,第一因子是0.4,第二因子是0.7。41.根据权利要求23至40中任一项所述的解码器,其中,所述解码器(31)被配置为:如果先前主帧(4a)丢失,则不考虑从所述部分副本(8b)解码的音调,并且其中所述解码器(31)被配置为:将音调固定为预测音调以用于后续丢失的主帧,而不是使用所发送的音调。42.一种系统,包括根据权利要求1至21中任一项所述的编码器(1)和根据权利要求22至41中任一项所述的解码器(31)。43.一种用于对类语音内容和/或一般音频内容(2)进行编码的方法,所述方法包括以下步骤:至少在一些帧(8)中将参数(6)嵌入比特流(5)中,所述参数(6)在原始帧(4)丢失、损坏或延迟的情况下增强隐藏。44.一种用于对类语音内容和/或一般音频内容进行解码的方法,所述方法包括以下步骤:在原始帧(4)丢失、损坏或延迟的情况下使用在时...
【专利技术属性】
技术研发人员:热雷米·勒康特,本杰明·舒伯特,迈克尔·施内伯,马丁·迪茨,
申请(专利权)人:弗劳恩霍夫应用研究促进协会,
类型:发明
国别省市:德国,DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。