语音通信中的帧擦除隐蔽制造技术

技术编号:3044848 阅读:164 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种语音解码器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数。所述语音解码器包含言语产生器,其根据所述语音参数产生言语。帧擦除隐蔽模块经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中的帧擦除的语音参数。

【技术实现步骤摘要】
【国外来华专利技术】语音通信中的帧擦除隐蔽
本揭示案大体上涉及语音通信,且更明确地说,涉及用于语音通信的帧擦除隐蔽技术。
技术介绍
传统上,已经通过电路交换网络执行数字语音通信。电路交换网络是一种在呼叫的 持续时间内在两个终端之间建立物理路径的网络。在电路交换应用中,发射终端将含有 语音信息的包序列经由所述物理路径发送到接收终端。接收终端使用包中含有的语音信 息来合成言语。如果在传输中丢失了包,那么接收终端可尝试隐蔽丢失的信息。这可通 过根据先前接收的包中的信息重构丢失的包中所含有的语音信息来实现。当前的技术发展已经为经由包交换网络进行数字语音通信铺平了道路。包交换网络 是一种基于目的地地址通过网络路由包的网络。通过包交换通信,路由器个别地为每个 包确定路径,沿着任何可用的路径发送包从而到达其目的地。由此,包并不是同时或者 以相同次序到达接收终端。在接收终端中可使用抖动缓冲器以将包放回原来的次序并以 连续循序方式播放出来。
技术实现思路
抖动缓冲器的存在提出了改进丢失包的重构语音信息的质量的独特机会。由于抖动 缓冲器在播放由接收终端接收的包之前对其进行存储,因此可根据播放序列中在丢失包 之前和之后的包中的信息为丢失包重构语音信息。本专利技术揭示一种语音解码器。所述语音解码器包含言语产生器,其经配置以接收帧 序列,其中每一所述帧均具有语音参数,且所述言语产生器还经配置以根据所述语音参 数产生言语。所述语音解码器还包含帧擦除隐蔽模块,其经配置以根据先前帧中一者的 语音参数和后续帧中一者的语音参数来重构用于所述帧序列中帧擦除的语音参数。本专利技术揭示一种解码语音的方法。所述方法包含接收帧序列,每一所述帧均具有 语音参数;根据先前帧中一者的语音参数和后续帧中一者的语音参数重构用于所述帧序 列中帧擦除的语音参数;以及根据所述帧序列中的语音参数产生言语。本专利技术揭示一种语音解码器,其经配置以接收帧序列。每一所述帧均包含语音参数。 所述语音解码器包含用于根据所述语音参数产生言语的装置;以及用于根据先前帧中 一者的语音参数和后续帧中一者的语音参数重构用于所述帧序列中帧擦除的语音参数的 装置。本专利技术还揭示一种通信终端。所述通信终端包含接收器以及语音解码器,所述语音 解码器经配置以从所述接收器接收帧序列,每一所述帧均具有语音参数。所述语音解码 器包含言语产生器,其经配置以根据所述语音参数产生言语;以及帧擦除隐蔽模块, 其经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧 序列中帧擦除的语音参数。应了解,所属领域的技术人员从以下具体实施方式将容易了解本专利技术的其它实施例, 其中以说明方式展示和描述本专利技术的各种实施例。将意识到,本专利技术能够具有其它和不 同的实施例,且其若干细节能够在各种其它方面中进行修改,所有这些都不脱离本专利技术 的精神和范围。因此,将附图和具体实施方式视为本质上是说明性的而不是限制性的。 附图说明附图中以实例方式而并非以限制方式来说明本专利技术的各方面,其中图1是说明经由传输媒体的发射终端和接收终端的实例的概念方框图;图2是说明发射终端中的语音编码器的实例的概念方框图;图3是图l所示的接收终端的更详细的概念方框图;以及图4是说明语音解码器中的帧擦除隐蔽模块的功能性的流程图。具体实施方式下文结合附图陈述的具体实施方式希望作为对本专利技术各种实施例的描述,且不希望 代表可实践本专利技术的仅有实施例。所述具体实施方式出于提供对本专利技术的详尽理解的目 的而包含特定细节。然而,所属领域的技术人员将易于了解,可在没有这些特定细节的 情况下实践本专利技术。在某些情况下,以方框图形式展示众所周知的结构和组件,以便避 免混淆本专利技术的概念。图1是说明经由传输媒体的发射终端102和接收终端104的实例的概念方框图。发 射终端102和接收终端104可以是能够支持语音通信的任何装置,包含电话、计算机、 音频广播和接收设备、视频会议设备等。在一个实施例中,发射终端102和接收终端104 经实施为具有无线码分多址(CDMA)能力,但实际上可用任何多址技术来实施。CDMA 是此项技术中众所周知的基于展频通信的调制和多址方案。发射终端102经展示为具有语音编码器106,且接收终端104经展示为具有语音解 码器108。语音编码器106可用于通过基于人类言语产生模型提取参数来压縮来自用户 接口 110的言语。发射器112可用于将含有这些参数的包传输穿过传输媒体114。传输媒 体114可以是基于包的网络(例如因特网或公司内网),或任何其它传输媒体。传输媒体 112的另一端处的接收器116可用于接收包。语音解码器108使用包中的参数来合成言语。 接着可将合成的言语提供到接收终端104上的用户接口 118。尽管未图示,但在发射器 112和接收器116两者中可执行各种信号处理功能,例如包含循环冗余检查(CRC)功能 的巻积编码、交错、数字调制和展频处理。在大多数应用中,通信的每一方进行发射以及接收。因此,每一终端将需要语音编 码器和解码器。语音编码器和解码器可以是单独的装置或集成为称作声码器的单一 装置。在以下具体实施方式中,将把终端102、 104描述为在传输媒体114的一端处具有 语音编码器106且在另一端处具有语音解码器108。所属领域的技术人员将容易认识到 如何将本文描述的概念扩展到双向通信。在发射终端102的至少一个实施例中,言语可以成帧地从用户接口 IIO输入到语音 编码器106,其中每一帧进一步分割为多个子帧。这些任意的帧边界通常用在执行某个 区块处理的地方,此处通常就是这样的情况。然而,如果实施连续处理而不是区块处理, 那么就不需要将言语样本分割为帧(和子帧)。所属领域的技术人员将容易认识到可如何 将下文描述的区块技术扩展到连续处理。在所描述的实施例中,取决于特定应用和总体 设计约束,传输穿过传输媒体114的每个包可含有一个或一个以上帧。语音编码器106可以是可变速率或固定速率编码器。取决于言语含量,可变速率编 码器逐帧地在多种编码器模式之间动态切换。语音解码器108也逐帧地在相应的解码器 模式之间动态切换。针对每一帧选择特定模式,以实现可用的最低位速率,且同时在接 收终端104处维持可接受的信号再现。举例来说,可以全速率或半速率来编码主动言语。 通常以八分之一速率来编码背景噪音。可变速率和固定速率编码器都是此项技术中众所 周知的。语音编码器106和解码器108可使用线性预测编码(LPC)。支持LPC编码的基本想 法是,可通过以其强度和音高为特征的言语源(声带)对言语建立模型。来自声带的言 语行进通过以其共振(称为共振峰)为特征的声道(喉咙和嘴)。LPC语音编码器106 通过估计共振峰、从言语中移除其影响并估计剩余言语的强度和音高来分析言语。接收 端处的LPC语音解码器108通过反转所述过程来合成言语。明确地说,LPC语音解码器 108使用剩余言语来产生言语源,使用共振峰来产生滤波器(其代表声道),并使言语源穿过滤波器以合成言语。图2是说明LPC语音编码器106的实例的概念方框图。LPC语音编码器106包含LPC 模块202,其从言语中估计共振峰。基本解决方案是差分等式,其将帧中的每一言语样 本表达为先前言语样本的线性组合(言语样本的短期相关性)。差分本文档来自技高网...

【技术保护点】
一种语音解码器,其包括:    言语产生器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数,且所述言语产生器经配置以根据所述语音参数产生言语;以及    帧擦除隐蔽模块,其经配置以根据一个或一个以上先前帧中的语音参数和一个或一个以上后续帧中的语音参数来重构用于所述帧序列中的帧擦除的语音参数。

【技术特征摘要】
【国外来华专利技术】US 2005-1-31 11/047,8841. 一种语音解码器,其包括言语产生器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数,且所 述言语产生器经配置以根据所述语音参数产生言语;以及帧擦除隐蔽模块,其经配置以根据一个或一个以上先前帧中的语音参数和一个或 一个以上后续帧中的语音参数来重构用于所述帧序列中的帧擦除的语音参数。2. 根据权利要求1所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以根据 包含所述先前帧中所述一者的多个所述先前帧中的语音参数和包含所述后续帧中 所述一者的多个所述后续帧中的语音参数来重构用于所述帧擦除的语音参数。3. 根据权利要求1所述的语音解码器,其中所述帧擦除隐蔽模块经配置以响应于确定 来自所述先前帧中的所述一者和未来帧中的所述一者的帧速率均高于阈值而根据 所述先前帧中所述一者中的语音参数和所述后续帧中所述一者中的语音参数重构 用于所述帧序列中的帧擦除的语音参数。4. 根据权利要求1所述的语音解码器,其进一步包括抖动缓冲器,所述抖动缓冲器经 配置以将所述帧以正确的顺序提供到所述言语产生器。5. 根据权利要求4所述的语音解码器,其中所述抖动缓冲器进一步经配置以将来自所述先前帧中所述一者或一者以上的语音参数和来自所述后续帧中所述一者或一者 以上的语音参数提供到所述帧擦除隐蔽模块以重构用于所述帧擦除的语音参数。6. 根据权利要求1所述的语音解码器,其进一步包括帧错误检测器,所述帧错误检测 器经配置以检测所述帧擦除。7. 根据权利要求l所述的语音解码器,其中所述帧中每一者中的语音参数均包含线谱 对,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述一者中的 线谱对与所述后续帧中所述一者中的线谱对之间进行内插来重构用于所述经擦除 帧的线谱对。8. 根据权利要求l所述的语音解码器,其中所述帧中每一者中的语音参数均包含延迟 和差值,所述差值指示所述延迟与最近先前帧的延迟之间的差,且其中所述帧擦除 隐蔽模块进一步经配置以在所述后续帧中的所述一者是下一帧且所述帧擦除隐蔽 模块确定所述后续帧中所述一者中的差值在某一范围内时,根据所述后续帧中所述 一者中的差值来重构用于所述经擦除帧的延迟。9. 根据权利要求8所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所 述后续帧中的所述一者不是下一帧时,通过在所述先前帧中所述一者中的延迟与所 述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。10. 根据权利要求8所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所 述帧擦除隐蔽模块确定所述后续帧中所述一者中的延迟值在所述范围外时,通过在 所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插 来重构用于所述经擦除帧的延迟。11. 根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含自适 应码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述 一者中的自适应码本增益与所述后续帧中所述一者中的自适应码本增益之间进行 内插来重构用于所述经擦除帧的自适应码本增益。12. 根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含自适 应码本增益、延迟和差值,所述差值指示所述延迟与所述最近先前帧的延迟之间的 差,且帧擦除隐蔽模块进一步经配置以在可根据所述后续帧中所述一者中的差值确 定所述经擦除帧的延迟时通过将所述自适应码本增益设定为某一值来重构用于所 述经擦除帧的自适应码本增益,所述值大于所述先前帧中的所述一者与所述后续帧 中的所述一者之间的内插自适应码本增益。13. 根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含固定 码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过将用于所述经擦除帧的 固定码本增益设定为零来重构用于所述经擦除帧的语音参数。14. 一种解码语音的方法,其包括接收帧序列,所述帧中的每一者均具有语音参数;根据至少一个先前帧中的语音参数和来自至少一个后续帧的语音参数重构用于 所述帧序列中的帧擦除的语音参数;以及 根据所述帧序列中的语音参数产生言语。15. 根据权利要求14所述的方法,其中根据包含所述先前帧中所述一者的多个所述先 前帧中的语音参数和包含所述后续帧中所述一者的多个所述后续帧中的语音参数 来重构用于所述帧擦除的语音参数。16. 根据权利要求14所述的方法,其进一步包括确定来自所述先前帧中的所述一者和 未来帧中的所述一者的帧速率均高于阈值,以及响应于所述确定而根据来自所述先 前帧中所述一者的语音参数和来自所述后续帧中所述一者的语音参数重构用于所 述帧序列中的帧擦除的语音参数。17. 根据权利要求14所述的方法,其进一步包括对所述帧重新排序以使得以正确的顺 序接收所述帧。18. 根据权利要求14所述的方法,其进一步包括检测所述帧擦除。19. 根据权利要求14所述的方法,其中所述帧中每一者中的语音参数均包含线谱对, 且其中通过在所述先前帧中所述一者中的线谱对与所述后续帧中所述一者中的线 谱对之间进行内插来重构用于所述经擦除帧的线谱对。20. 根据权利要求14所述的方法,其中所述后续帧中的所述一者是跟随所述经擦除帧 的下一帧,且其中所述帧中每一者中的语音参数均包含延迟和差值,所述差值指示 所述延迟与最近先前帧的延迟之间的差,且其中响应于确定所述后续帧中所述一者 中的差值...

【专利技术属性】
技术研发人员:塞拉芬迪亚兹斯平多拉
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1