用于对无效帧进行宽带编码和解码的系统、方法和设备技术方案

技术编号:8801845 阅读:158 留言:0更新日期:2013-06-13 06:19
本发明专利技术涉及用于对无效帧进行宽带编码和解码的系统、方法和设备。在一方面,本发明专利技术揭示以不同速率对无效帧进行编码的语音编码器和语音编码方法。本发明专利技术揭示用于处理经编码语音信号的设备和方法,其基于对在第一频带上的频谱包络的描述和对在第二频带上的频谱包络的描述而计算经解码帧,其中所述针对所述第一频带的描述基于来自对应经编码帧的信息且所述针对所述第二频带的描述基于来自至少一个先前经编码帧的信息。对所述经解码帧的计算还可基于对针对所述第二频带的时间信息的描述,所述描述基于来自至少一个先前经编码帧的信息。

【技术实现步骤摘要】

本专利技术涉及对语音信号的处理。
技术介绍
通过数字技术进行的话音传输已变得较为普遍,尤其是在长距离电话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换电话和例如蜂窝式电话等数字无线电电话中。此迅速扩散已使得产生了对减少用以经由传输信道传送话音通信的信息量且同时维持重构语音的感知质量的关注。经配置以通过提取与人类语音产生模型相关的参数而压缩语音的装置被称为“语音编码装置”。语音编码装置通常包括编码器和解码器。编码器通常将传入的语音信号(表示音频信息的数字信号)划分为称为“帧”的时间片段,分析每一帧以提取某些相关参数且将所述参数量化为经编码帧。经由传输信道(即,有线或无线网络连接)将经编码帧传输到包括解码器的接收器。解码器接收并处理经编码帧,对其进行解量化以产生参数,且使用经解量化的参数来重建语音中贞。在典型的会话中,每一说话者在约百分之六十的时间内是静默的。语音编码器通常经配置以区分语音信号的含有语音的帧(“有效帧”)与语音信号的仅含有静默或背景噪声的帧(“无效帧”)。此编码器可经配置以使用不同编码模式和/或速率来对有效和无效帧进行编码。举例来说,语音编码器通常经配置以使用比对有效帧进行编码所使用的位少的位来对无效帧进行编码。语音编码装置可对无效帧使用较低位速率,以支持以较低平均位速率进行语音信号传送,其中存在极少到毫无的感知质量损失。图1说明对语音信号的包括有效帧与无效帧之间的过渡的区域进行编码的结果。图式中的每一竖条指示对应帧,其中竖条的高度指示对帧进行编码的位速率,且横轴指示时间。在此情况下,以较高位速率rH对有效帧进行编码且以较低位速率rL对无效帧进行编码。位速率rH的实例包括每帧171位、每帧80位和每帧40位;且位速率rL的实例包括每帧16位。在蜂窝式电话系统(尤其是顺从如由弗吉尼亚州阿灵顿电信工业协会(Telecommunications Industry Association, Arlington, VA)发布的暂用标准(IS)-95或类似工业标准的系统)的情形中,这四个位速率还分别称为“全速率”、“半速率”、“四分之一速率”和“八分之一速率”。在图1所示的结果的一个特定实例中,速率rH为全速率且速率rL为八分之一速率。传统上已在带宽方面将经由公众交换电话网络(PSTN)的话音通信限于300到3400千赫(kHz)的频率范围。较新近的用于话音通信的网络(例如使用蜂窝式电话和/或VoIP的网络)可能并无相同的带宽限制,且可能需要使用此类网络的设备具有传输和接收包括宽带频率范围的话音通信的能力。举例来说,可能需要此类设备支持向下延伸到50Hz且/或向上延伸到7或8kHz的音频频率范围。还可能需要此类设备支持其它应用,例如高质量音频或音频/视频会议、对例如音乐和/或电视等多媒体服务的传递等等,所述应用可能具有在传统PSTN界限以外的范围内的音频语音内容。语音编码装置所支持的范围向较高频率中的延伸可改进清晰度。举例来说,语音信号中区别例如“s”和“f”等摩擦音的信息主要处于较高频率中。高带延伸还可改进经解码语音信号的其它质量,例如真实感。举例来说,甚至有声元音也可能具有远高于PSTN频率范围的频谱能量。虽然可能需要语音编码装置支持宽带频率范围,但还需要限制用以经由传输信道传送话音通信的信息的量。语音编码装置可经配置以执行(例如)不连续传输(DTX),使得并不针对语音信号的全部无效帧均传输描述。
技术实现思路
根据一种配置的对语音信号的帧进行编码的方法包括:产生第一经编码帧,所述第一经编码帧基于语音信号的第一帧且具有P个位的长度,其中P为非零正整数;产生第二经编码帧,所述第二经编码帧基于语音信号的第二帧且具有q个位的长度,其中q为不同于P的非零正整数;以及产生第三经编码帧,所述第三经编码帧基于语音信号的第三帧且具有r个位的长度,其中r为小于q的非零正整数。在此方法中,第二帧是在语音信号中跟随第一帧之后的无效帧,第三帧是在语音信号中跟随第二帧之后的无效帧,且语音信号的在第一与第三帧之间的所有帧均为无效的。根据另一配置的对语音信号的帧进行编码的方法包括产生第一经编码帧,所述第一经编码帧基于语音信号的第一帧且具有q个位的长度,其中q为非零正整数。此方法还包括产生第二经编码帧,所述第二经编码帧基于语音信号的第二帧且具有r个位的长度,其中r为小于q的非零正整数。在此方法中,第一和第二帧为无效帧。在此方法中,第一经编码帧包括(A)对语音信号的包括第一帧的部分的在第一频带上的频谱包络的描述和(B)对语音信号的包括第一帧的部分的在不同于第一频带的第二频带上的频谱包络的描述,且第二经编码帧(A)包括对语音信号的包括第二帧的部分的在第一频带上的频谱包络的描述且(B)不包括对在第二频带上的频谱包络的描述。还明确地预期且在本文中揭示用于执行此类操作的装置。还明确地预期且在本文中揭示包括计算机可读媒体的计算机程序产品,其中所述媒体包括用于致使至少一个计算机执行此类操作的代码。还明确地预期且在本文中揭示包括经配置以执行此类操作的语音活动性检测器、编码方案选择器和语音编码器的设备。根据另一配置的用于对语音信号的帧进行编码的设备包括:用于基于语音信号的第一帧而产生具有P个位的长度的第一经编码帧的装置,其中P为非零正整数;用于基于语音信号的第二帧而产生具有q个位的长度的第二经编码帧的装置,其中q为不同于P的非零正整数;以及用于基于语音信号的第三帧而产生具有r个位的长度的第三经编码帧的装置,其中r为小于q的非零正整数。在此设备中,第二帧是在语音信号中跟随第一帧之后的无效帧,第三帧是在语音信号中跟随第二帧之后的无效帧,且语音信号的在第一与第三帧之间的所有帧均为无效的。根据另一配置的计算机程序产品包括计算机可读媒体。所述媒体包括:用于致使至少一个计算机产生第一经编码帧的代码,所述第一经编码帧基于语音信号的第一帧且具有P个位的长度,其中P为非零正整数;用于致使至少一个计算机产生第二经编码帧的代码,所述第二经编码帧基于语音信号的第二帧且具有q个位的长度,其中q为不同于P的非零正整数;以及用于致使至少一个计算机产生第三经编码帧的代码,所述第三经编码帧基于语音信号的第三帧且具有r个位的长度,其中r为小于q的非零正整数。在此产品中,第二帧是在语音信号中跟随第一帧之后的无效帧,第三帧是在语音信号中跟随第二帧之后的无效帧,且语音信号的在第一与第三帧之间的所有帧均为无效的。根据另一配置的用于对语音信号的帧进行编码的设备包括:语音活动性检测器,其经配置以针对语音信号的多个帧中的每一者指示所述帧是有效的还是无效的;编码方案选择器;以及语音编码器。编码方案选择器经配置以(A)响应于语音活动性检测器对语音信号的第一巾贞的指不而选择第一编码方案;(B)针对作为在语音信号中跟随第一巾贞之后的一连续系列的无效帧中的一者的第二帧且响应于语音活动性检测器关于第二帧为无效的指示而选择第二编码方案;且(C)针对在语音信号中跟随第二帧之后并作为在语音信号中跟随第一帧之后的连续系列的无效帧中的另一者的第三帧且响应于语音活动性检测器关于第三帧为无效的指示而选择第三编码方案。语音编码器经配置以(D)根据第一编码方案而产生第一经编码帧,所述第一经编码帧基于本文档来自技高网
...

【技术保护点】
一种用于对语音信号的帧进行编码的设备,所述设备包含:语音活动性检测器,其经配置以针对所述语音信号的多个帧中的每一者而指示所述帧是有效的还是无效的;编码方案选择器,其经配置以(A)响应于所述语音活动性检测器对所述语音信号的第一帧的指示而选择第一编码方案,(B)针对作为出现于所述第一帧之后的一连续系列的无效帧中的一者的第二帧且响应于所述语音活动性检测器关于所述第二帧为无效的指示而选择第二编码方案,且(C)针对在所述语音信号中跟随所述第二帧之后并作为出现于所述第一帧之后的所述连续系列的无效帧中的另一者的第三帧且响应于所述语音活动性检测器关于所述第三帧为无效的指示而选择第三编码方案;和语音编码器,其经配置以(D)根据所述第一编码方案,产生第一经编码帧,所述第一经编码帧基于所述第一帧且具有p个位的长度,其中p为非零正整数,(E)根据所述第二编码方案,产生第二经编码帧,所述第二经编码帧基于所述第二帧且具有q个位的长度,其中q为不同于p的非零正整数,且(F)根据所述第三编码方案,产生第三经编码帧,所述第三经编码帧基于所述第三帧且具有r个位的长度,其中r为小于q的非零正整数。

【技术特征摘要】
2006.07.31 US 60/834,688;2007.07.30 US 11/830,8121.一种用于对语音信号的帧进行编码的设备,所述设备包含: 语音活动性检测器,其经配置以针对所述语音信号的多个帧中的每一者而指示所述帧是有效的还是无效的; 编码方案选择器,其经配置以 (A)响应于所述语音活动性检测器对所述语音信号的第一帧的指示而选择第一编码方案, (B)针对作为出现于所述第一帧之后的一连续系列的无效帧中的一者的第二帧且响应于所述语音活动性检测器关于所述第二帧为无效的指示而选择第二编码方案,且 (C)针对在所述语音信号中跟随所述第二帧之后并作为出现于所述第一帧之后的所述连续系列的无效帧中的另一者的第三帧且响应于所述语音活动性检测器关于所述第三帧为无效的指示而选择第三编码方案;和 语音编码器,其 经配置以 (D)根据所述第一编码方案,产生第一经编码帧,所述第一经编码帧基于所述第一帧且具有P个位的长度,其中P为非零正整数, (E)根据所述第二编码方案,产生第二经编码帧,所述第二经编码帧基于所述第二帧且具有q个位的长度,其中q为不同于P的非零正整数,且 (F)根据所述第三编码方案,产生第三经编码帧,所述第三经编码帧基于所述第三帧且具有r个位的长度,其中r为小于q的非零正整数。2.根据权利要求1所述的设备,其中在所述语音信号中,至少一个帧出现于所述第一帧与所述第二帧之间。3.根据权利要求1所述的设备,其中所述语音编码器经配置以将所述第二经编码帧产生为包括(A)对所述语音信号的包括所述第二帧的部分的在第一频带上的频谱包络的描述和(B)对所述语音信号的包括所述第二帧的部分的在不同于所述第一频带的第二频带上的频谱包络的描述。4.根据权利要求3所述的设备,其中所述语音编码器经配置以将所述第三经编码帧产生为(A)包括对在所述第一频带上的频谱包络的描述且(B)不包括对在所述第二频带上的频谱包络的描述。5.根据权利要求1所述的设备,其中所述语音编码器经配置以将所述第三经编码帧产生为包括对所述语音信号的包括所述第三帧的部分的频谱包络的描述。6.一种处理经编码语音信号的方法,所述方法包含: 基于来自所述经编码语音信号的第一经编码帧的信息,获得对语音信号的第一帧的在(A)第一频带和(B)不同于所述第一频带的第二频带上的频谱包络的描述; 基于来自所述经编码语音信号的第二经编码帧的信息,获得对所述语音信号的第二帧的在所述第一频带上的频谱包络的描述;和 基于来自所述第一经编码帧的信息,获得对所述第二帧的在所述第二频带上的频谱包络的描述。7.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述语音信号的第二帧的在所述第一频带上的频谱包络的描述至少主要地基于来自所述第二经编码帧的信息。8.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述至少主要地基于来自所述第一经编码帧的信息。9.根据权利要求6所述的处理经编码语音信号的方法,其中所述对第一帧的频谱包络的描述包括对所述第一帧的在所述第一频带上的频谱包络的描述和对所述第一帧的在所述第二频带上的频谱包络的描述。10.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的所述信息包括所述对所述第一帧的在所述第二频带上的频谱包络的描述。11.根据权利要求6所述的处理经编码语音信号的方法,其中根据宽带编码方案对所述第一经编码帧进行编码,且其中根据窄带编码方案对所述第二经编码帧进行编码。12.根据权利要求6所述的处理经编码语音信号的方法,其中所述第一经编码帧的以位计的长度为所述第二经编码帧的以位计的长度的至少两倍。13.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含基于所述对所述第二帧的在所述第一频带上的频谱包络的描述、所述对所述第二帧的在所述第二频带上的频谱包络的描述和至少主要地基于随机噪声信号的激励信号而计算所述第二帧。14.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述基于来自所述经编码语音信号的第三经编码帧的信息,其中所述第一和第三经编码帧两者在所述经编码语音信号中出现于所述第二经编码帧之前。15.根据权利要求14所述的处理经编码语音信号的方法,其中所述来自第三经编码帧的信息包括对所述语音信号的第三帧的在所述第二频带上的频谱包络的描述。16.根据权利要求1 4所述的处理经编码语音信号的方法,其中所述对所述第一帧的在所述第二频带上的频谱包络的描述包括频谱参数值向量,且 其中所述对所述第三帧的在所述第二频带上的频谱包络的描述包括频谱参数值向量,且 其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述包括将所述第二帧的频谱参数值向量计算为所述第一帧的所述频谱参数值向量和所述第三帧的所述频谱参数值向量的函数。17.根据权利要求14所述的处理经编码语音信号的方法,所述方法包含: 响应于检测到所述第一经编码帧的编码索引满足至少一个预定标准,存储所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的来自所述第一经编码帧的所述信息; 响应于检测到所述第三经编码帧的编码索引满足至少一个预定标准,存储所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的来自所述第三经编码帧的所述信息;和 响应于检测到所述第二经编码帧的编码索引满足至少一个预定标准,检索来自所述第一经编码帧的所述所存储的信息和来自所述第三经编码帧的所述所存储的信息。18.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含针对所述语音信号的跟随所述第二帧之后的多个帧中的每一者而获得对所述帧的在所述第二频带上的频谱包络的描述,其中所述描述基于来自所述第一经编码帧的信息。19.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含针对所...

【专利技术属性】
技术研发人员:维韦克·拉金德朗阿南塔帕德马那伯罕·A·坎达哈达伊
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1