【技术实现步骤摘要】
本专利技术涉及对语音信号的处理。
技术介绍
通过数字技术进行的话音传输已变得较为普遍,尤其是在长距离电话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换电话和例如蜂窝式电话等数字无线电电话中。此迅速扩散已使得产生了对减少用以经由传输信道传送话音通信的信息量且同时维持重构语音的感知质量的关注。经配置以通过提取与人类语音产生模型相关的参数而压缩语音的装置被称为“语音编码装置”。语音编码装置通常包括编码器和解码器。编码器通常将传入的语音信号(表示音频信息的数字信号)划分为称为“帧”的时间片段,分析每一帧以提取某些相关参数且将所述参数量化为经编码帧。经由传输信道(即,有线或无线网络连接)将经编码帧传输到包括解码器的接收器。解码器接收并处理经编码帧,对其进行解量化以产生参数,且使用经解量化的参数来重建语音中贞。在典型的会话中,每一说话者在约百分之六十的时间内是静默的。语音编码器通常经配置以区分语音信号的含有语音的帧(“有效帧”)与语音信号的仅含有静默或背景噪声的帧(“无效帧”)。此编码器可经配置以使用不同编码模式和/或速率来对有效和无效帧进行编码。举例来说,语音编码器通常经配置以使用比对有效帧进行编码所使用的位少的位来对无效帧进行编码。语音编码装置可对无效帧使用较低位速率,以支持以较低平均位速率进行语音信号传送,其中存在极少到毫无的感知质量损失。图1说明对语音信号的包括有效帧与无效帧之间的过渡的区域进行编码的结果。图式中的每一竖条指示对应帧,其中竖条的高度指示对帧进行编码的位速率,且横轴指示时间。在此情况下,以较高位速率rH对有效帧进行编码且以较低 ...
【技术保护点】
一种用于对语音信号的帧进行编码的设备,所述设备包含:语音活动性检测器,其经配置以针对所述语音信号的多个帧中的每一者而指示所述帧是有效的还是无效的;编码方案选择器,其经配置以(A)响应于所述语音活动性检测器对所述语音信号的第一帧的指示而选择第一编码方案,(B)针对作为出现于所述第一帧之后的一连续系列的无效帧中的一者的第二帧且响应于所述语音活动性检测器关于所述第二帧为无效的指示而选择第二编码方案,且(C)针对在所述语音信号中跟随所述第二帧之后并作为出现于所述第一帧之后的所述连续系列的无效帧中的另一者的第三帧且响应于所述语音活动性检测器关于所述第三帧为无效的指示而选择第三编码方案;和语音编码器,其经配置以(D)根据所述第一编码方案,产生第一经编码帧,所述第一经编码帧基于所述第一帧且具有p个位的长度,其中p为非零正整数,(E)根据所述第二编码方案,产生第二经编码帧,所述第二经编码帧基于所述第二帧且具有q个位的长度,其中q为不同于p的非零正整数,且(F)根据所述第三编码方案,产生第三经编码帧,所述第三经编码帧基于所述第三帧且具有r个位的长度,其中r为小于q的非零正整数。
【技术特征摘要】
2006.07.31 US 60/834,688;2007.07.30 US 11/830,8121.一种用于对语音信号的帧进行编码的设备,所述设备包含: 语音活动性检测器,其经配置以针对所述语音信号的多个帧中的每一者而指示所述帧是有效的还是无效的; 编码方案选择器,其经配置以 (A)响应于所述语音活动性检测器对所述语音信号的第一帧的指示而选择第一编码方案, (B)针对作为出现于所述第一帧之后的一连续系列的无效帧中的一者的第二帧且响应于所述语音活动性检测器关于所述第二帧为无效的指示而选择第二编码方案,且 (C)针对在所述语音信号中跟随所述第二帧之后并作为出现于所述第一帧之后的所述连续系列的无效帧中的另一者的第三帧且响应于所述语音活动性检测器关于所述第三帧为无效的指示而选择第三编码方案;和 语音编码器,其 经配置以 (D)根据所述第一编码方案,产生第一经编码帧,所述第一经编码帧基于所述第一帧且具有P个位的长度,其中P为非零正整数, (E)根据所述第二编码方案,产生第二经编码帧,所述第二经编码帧基于所述第二帧且具有q个位的长度,其中q为不同于P的非零正整数,且 (F)根据所述第三编码方案,产生第三经编码帧,所述第三经编码帧基于所述第三帧且具有r个位的长度,其中r为小于q的非零正整数。2.根据权利要求1所述的设备,其中在所述语音信号中,至少一个帧出现于所述第一帧与所述第二帧之间。3.根据权利要求1所述的设备,其中所述语音编码器经配置以将所述第二经编码帧产生为包括(A)对所述语音信号的包括所述第二帧的部分的在第一频带上的频谱包络的描述和(B)对所述语音信号的包括所述第二帧的部分的在不同于所述第一频带的第二频带上的频谱包络的描述。4.根据权利要求3所述的设备,其中所述语音编码器经配置以将所述第三经编码帧产生为(A)包括对在所述第一频带上的频谱包络的描述且(B)不包括对在所述第二频带上的频谱包络的描述。5.根据权利要求1所述的设备,其中所述语音编码器经配置以将所述第三经编码帧产生为包括对所述语音信号的包括所述第三帧的部分的频谱包络的描述。6.一种处理经编码语音信号的方法,所述方法包含: 基于来自所述经编码语音信号的第一经编码帧的信息,获得对语音信号的第一帧的在(A)第一频带和(B)不同于所述第一频带的第二频带上的频谱包络的描述; 基于来自所述经编码语音信号的第二经编码帧的信息,获得对所述语音信号的第二帧的在所述第一频带上的频谱包络的描述;和 基于来自所述第一经编码帧的信息,获得对所述第二帧的在所述第二频带上的频谱包络的描述。7.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述语音信号的第二帧的在所述第一频带上的频谱包络的描述至少主要地基于来自所述第二经编码帧的信息。8.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述至少主要地基于来自所述第一经编码帧的信息。9.根据权利要求6所述的处理经编码语音信号的方法,其中所述对第一帧的频谱包络的描述包括对所述第一帧的在所述第一频带上的频谱包络的描述和对所述第一帧的在所述第二频带上的频谱包络的描述。10.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的所述信息包括所述对所述第一帧的在所述第二频带上的频谱包络的描述。11.根据权利要求6所述的处理经编码语音信号的方法,其中根据宽带编码方案对所述第一经编码帧进行编码,且其中根据窄带编码方案对所述第二经编码帧进行编码。12.根据权利要求6所述的处理经编码语音信号的方法,其中所述第一经编码帧的以位计的长度为所述第二经编码帧的以位计的长度的至少两倍。13.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含基于所述对所述第二帧的在所述第一频带上的频谱包络的描述、所述对所述第二帧的在所述第二频带上的频谱包络的描述和至少主要地基于随机噪声信号的激励信号而计算所述第二帧。14.根据权利要求6所述的处理经编码语音信号的方法,其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述基于来自所述经编码语音信号的第三经编码帧的信息,其中所述第一和第三经编码帧两者在所述经编码语音信号中出现于所述第二经编码帧之前。15.根据权利要求14所述的处理经编码语音信号的方法,其中所述来自第三经编码帧的信息包括对所述语音信号的第三帧的在所述第二频带上的频谱包络的描述。16.根据权利要求1 4所述的处理经编码语音信号的方法,其中所述对所述第一帧的在所述第二频带上的频谱包络的描述包括频谱参数值向量,且 其中所述对所述第三帧的在所述第二频带上的频谱包络的描述包括频谱参数值向量,且 其中所述获得对所述第二帧的在所述第二频带上的频谱包络的描述包括将所述第二帧的频谱参数值向量计算为所述第一帧的所述频谱参数值向量和所述第三帧的所述频谱参数值向量的函数。17.根据权利要求14所述的处理经编码语音信号的方法,所述方法包含: 响应于检测到所述第一经编码帧的编码索引满足至少一个预定标准,存储所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的来自所述第一经编码帧的所述信息; 响应于检测到所述第三经编码帧的编码索引满足至少一个预定标准,存储所述获得对所述第二帧的在所述第二频带上的频谱包络的描述所依据的来自所述第三经编码帧的所述信息;和 响应于检测到所述第二经编码帧的编码索引满足至少一个预定标准,检索来自所述第一经编码帧的所述所存储的信息和来自所述第三经编码帧的所述所存储的信息。18.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含针对所述语音信号的跟随所述第二帧之后的多个帧中的每一者而获得对所述帧的在所述第二频带上的频谱包络的描述,其中所述描述基于来自所述第一经编码帧的信息。19.根据权利要求6所述的处理经编码语音信号的方法,所述方法包含针对所...
【专利技术属性】
技术研发人员:维韦克·拉金德朗,阿南塔帕德马那伯罕·A·坎达哈达伊,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。