使用在对音频信号的帧进行音调规则化(PR)编码期间计算的时间移位在非PR编码期间对另一帧的片段进行时间移位。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号的编码。
技术介绍
尤其是在长途电话、例如IP语音(还称作VoIP,其中IP表示因特网协议)等包交换电话及例如蜂窝式电话等数字无线电电话中,通过数字技术来传输音频信息(例如,话音及/或音乐)已变得较为普遍。此类扩散化已产生了对减少用以经由传输信道传送语音通信的信息量同时维持经重构话音的感知质量的关注。举例来说,需要有效利用可用系统带宽(尤其在无线系统中)。一种有效使用系统带宽的方法是采用信号压缩技术。对于携载话音信号的系统,出于此目的而通常采用话音压缩(或“话音译码”)技术。 经配置以通过提取与人类话音产生模型有关的参数来压缩话音的装置经常被称作音频译码器、语音译码器、编解码器、声码器或话音译码器,且以下描述可互换地使用这些术语。音频译码器通常包括编码器及解码器。编码器通常接收作为一系列样本块(称作“帧”)的数字音频信号,分析每一帧以提取某些相关参数,且量化所述参数以产生一系列对应经编码帧。经编码帧经由传输信道(即,有线或无线网络连接)传输到包括解码器的接收器。或者,经编码的音频信号可经存储以供在稍后时间进行检索并解码。解码器接收并处理经编码帧,对其进行逆量化以产生所述参数,且使用经逆量化的参数来重建话音帧。 码激励线性预测(“CELP”)是试图匹配原始音频信号的波形的译码方案。可能需要使用称作松弛CELP(“RCELP”)的CELP变型来对话音信号的帧(尤其是有声帧)进行编码。在RCELP译码方案中,波形匹配约束为松弛的。RCELP译码方案是音调规则化(“PR”)译码方案,因为通常通过改变音调脉冲的相对位置来规则化在信号的音调周期(还称作“延迟轮廓”)中的变化以匹配或接近较平滑的合成延迟轮廓。音调规则化通常允许以较少位编码音调信息,其中感知质量稍有降低到没有降低。通常,并无指定规则化量的信息传输到解码器。以下文献描述包括RCELP译码方案的译码系统第三代合作伙伴计划2(“3GPP2”)文献C.S0030-0,v3.0,标题为“用于宽带扩展频谱通信系统的可选模式声码器(SMV)服务选项(Selectable Mode Vocoder(SMV)Service Option for Wideband Spread Spectrum Communication Systems”,2004年1月(在www.3gpp.org处在线可得);以及3GPP2文献C.S0014-C,v1.0,标题为“用于宽带扩展频谱数字系统的增强型可变速率编解码器话音服务选项3、68和70(Enhanced VariableRate Codec,Speech Service Options 3,68,and 70 for Wideband Spread Spectrum DigitalSystems)”,2007年1月(在www.3gpp.org处在线可得)。用于有声帧的其它译码方案(包括例如原型音调周期(“PPP”)等原型波形内插(“PWI”)方案)也可实施为PR(例如,如在上文提及的3GPP2文献C.S0014-C的第4.2.4.3部分中所描述)。男性说话者的音调频率的常见范围包括50或70到150或200Hz,且女性说话者的音调频率的常见范围包括120或140到300或400Hz。 经由公共交换电话网(“PSTN”)的音频通信传统上在带宽上已限于300到3400千赫(kHz)的频率范围。用于音频通信的较新近网络(例如,使用蜂窝式电话及/或VoIP的网络)可能不具有相同带宽限制,且可能需要使用此类网络的设备具有发射及接收包括宽带频率范围的音频通信的能力。举例来说,可能需要此类设备支持延伸低达50Hz及/或高达7kHz或8kHz的音频范围。还可能需要此类设备支持可具有在传统PSTN限制外部的范围中的音频话音内容的其它应用,例如高质量音频或音频/视频会议、多媒体服务(例如,音乐及/或电视)的传递等。 话音译码器所支持的范围延伸到较高频率可改进可懂度。举例来说,在话音信号中区分例如“s”及“f”等摩擦音的信息大多为高频率。高带延伸还可改进经解码的话音信号的其它质量,例如真实感。举例来说,即使是有声元音也可具有远远高于PSTN频率范围的频谱能量。
技术实现思路
根据通用配置的处理音频信号的帧的方法包括根据音调规则化(“PR”)译码方案而对音频信号的第一帧进行编码;以及根据非PR译码方案而对音频信号的第二帧进行编码。在此方法中,第二帧在音频信号中跟随并连续于第一帧,且对第一帧进行编码包括基于时间移位而对基于第一帧的第一信号的片段进行时间修改,其中时间修改包括以下一者(A)根据所述时间移位而对第一帧的片段进行时间移位;以及(B)基于所述时间移位而对第一信号的片段进行时间扭曲。在此方法中,对第一信号的片段进行时间修改包括改变所述片段的音调脉冲相对于第一信号的另一音调脉冲的位置。在此方法中,对第二帧进行编码包括基于时间移位而对基于第二帧的第二信号的片段进行时间修改,其中时间修改包括以下一者(A)根据所述时间移位而对第二帧的片段进行时间移位;以及(B)基于所述时间移位而对第二信号的片段进行时间扭曲。还描述了具有用于以此方式处理音频信号的帧的指令的计算机可读媒体,以及用于以类似方式处理音频信号的帧的设备及系统。 根据另一通用配置的处理音频信号的帧的方法包括根据第一译码方案而对音频信号的第一帧进行编码;以及根据PR译码方案而对音频信号的第二帧进行编码。在此方法中,第二帧在音频信号中跟随并连续于第一帧,且第一译码方案为非PR译码方案。在此方法中,对第一帧进行编码包括基于第一时间移位而对基于第一帧的第一信号的片段进行时间修改,其中时间修改包括以下一者(A)根据第一时间移位而对第一信号的片段进行时间移位;以及(B)基于第一时间移位而对第一信号的片段进行时间扭曲。在此方法中,对第二帧进行编码包括基于第二时间移位而对基于第二帧的第二信号的片段进行时间修改,其中时间修改包括以下一者(A)根据第二时间移位而对第二信号的片段进行时间移位;以及(B)基于第二时间移位而对第二信号的片段进行时间扭曲。在此方法中,对第二信号的片段进行时间修改包括改变所述片段的音调脉冲相对于第二信号的另一音调脉冲的位置,且第二时间移位是基于来自第一信号的经时间修改片段的信息。还描述了具有用于以此方式处理音频信号的帧的指令的计算机可读媒体,以及用于以类似方式处理音频信号的帧的设备及系统。 附图说明 图1说明无线电话系统的实例。 图2说明经配置以支持包交换数据通信的蜂窝式电话系统的实例。 图3a说明包括音频编码器AE10及音频解码器AD10的译码系统的框图。 图3b说明一对译码系统的框图。 图4a说明音频编码器AE10的多模式实施方案AE20的框图。 图4b说明音频解码器AD10的多模式实施方案AD20的框图。 图5a说明音频编码器AE20的实施方案AE22的框图。 图5b说明音频编码器AE20的实施方案AE24的框图。 图6a说明音频编码器AE24的实施方案AE25的框图。 图6b说明音频编码器AE20的实施方案AE26的框图。 图7a说明对音频信号的帧进行编码的方法M10的流程图。 图7b说明经配置以对音频信号的帧进行编码的设备F10的框图。本文档来自技高网...
【技术保护点】
一种处理音频信号的帧的方法,所述方法包含: 根据音调规则化(PR)译码方案而对所述音频信号的第一帧进行编码;以及 根据非PR译码方案而对所述音频信号的第二帧进行编码, 其中所述第二帧在所述音频信号中跟随并连续于所述第一帧, 且 其中所述对第一帧进行编码包括基于时间移位而对基于所述第一帧的第一信号的片段进行时间修改,所述时间修改包括下列一者:(A)根据所述时间移位而对所述第一帧的所述片段进行时间移位;以及(B)基于所述时间移位而对所述第一信号的所述片段进行 时间扭曲,且 其中所述对第一信号的片段进行时间修改包括改变所述片段的音调脉冲相对于所述第一信号的另一音调脉冲的位置,且 其中所述对第二帧进行编码包括基于所述时间移位而对基于所述第二帧的第二信号的片段进行时间修改,所述时间修改包括 下列一者:(A)根据所述时间移位而对所述第二帧的所述片段进行时间移位;以及(B)基于所述时间移位而对所述第二信号的所述片段进行时间扭曲。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:维韦克拉金德朗,阿南塔帕德马纳卜汉A坎达哈达伊,文卡特什克里希南,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。