用于音频信号的相依模式译码的系统、方法、设备和计算机可读媒体技术方案

技术编号:8567400 阅读:242 留言:0更新日期:2013-04-12 00:48
一种用于对表示信号的音频-频率范围的一组变换系数进行译码的方案使用来自描述所述信号的先前帧的参考帧的信息来确定所述信号的目标帧中的显著能量区的频域位置。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理领域。
技术介绍
基于修正型离散余弦变换(MDCT)的译码方案通常用于对一般的音频信号进行译码,所述音频信号可包含语音和/或非语音内容,例如音乐。使用MDCT译码的现有音频编解码器的实例包含MPEG-1音频层3 (MP3)、杜比数字(英国伦敦杜比实验室;还被称为AC-3且标准化为ATSC A/52)、免费音乐格式(马萨诸塞州萨摩威尔市Xiph. Org基金会)、视窗媒体音频(WMA,华盛顿州里德蒙德市微软公司)、自适应变换声音译码(ATRAC,日本东京索尼公司),以及高级音频译码(AAC,最近在IS0/IEC14496-3:2009中标准化)。MDCT译码也是一些电信标准的分量,例如增强型可变速率编解码器(EVRC,在2010年I月25日的第3代合作伙伴项目2 (3GPP2)文献C. S0014-D v2. O中被标准化)。G. 718编解码器(对从8到32kbit/s的语音和音频的巾贞错误稳固窄带和宽带嵌入式可变位速率译码(Frame errorrobust narrowband and wideband embedded variable bit—rate coding of speech andaudio from8-32kbit/s),电信标准化部门(ITU-T),日内瓦,CH,2008 年 6 月,2008 年 11 月和2009年8月校正,2009年3月和2010年3月修正)是使用MDCT译码的多层编解码器的一个实例。
技术实现思路
根据一般配置的一种音频信号处理方法包含在频域中定位描述音频信号的帧的参考帧中的多个能量集中。此方法还包含,针对所述多个频域能量集中中的每一者,且基于所述集中的位置,选择所述音频信号的目标帧内的位置以用于所述目标帧的一组子频带中的对应一者,其中所述目标帧在所述音频信号中在由所述参考帧描述的帧之后。此方法还包含与所述目标帧的不在所述组子频带中的任一者中的样本分开地对所述目标帧的所述组子频带进行编码,以获得经编码分量。在此方法中,对于所述组子频带中的至少一者中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征致使机器读取所述特征来执行所述方法。一种用于根据一般配置处理音频信号的帧的设备包含用于在频域中定位描述音频信号的帧的参考帧中的多个能量集中的装置。此设备还包含,用于针对所述多个频域能量集中中的每一者且基于所述集中的位置来选择所述音频信号的目标帧内的位置以用于所述目标帧的一组子频带中的对应一者的装置,其中所述目标帧在所述音频信号中在由所述参考帧描述的帧之后。此设备包含用于与所述目标帧的不在所述组子频带中的任一者中的样本分开地对所述目标帧的所述组子频带进行编码以获得经编码分量的装置。在此设备中,对于所述组子频带中的至少一者中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。—种用于根据另一一般配置处理音频信号的帧的设备包含定位器,所述定位器经配置以在频域中定位描述音频信号的帧的参考帧中的多个能量集中。此设备还包含选择器,所述选择器经配置以针对所述多个频域能量集中中的每一者且基于所述集中的位置来选择所述音频信号的目标帧内的位置以用于所述目标帧的一组子频带中的对应一者,其中所述目标帧在所述音频信号中在由所述参考帧描述的帧之后。此设备包含编码器,所述编码器经配置以与所述目标帧的不在所述组子频带中的任一者中的样本分开地对所述目标帧的所述组子频带进行编码以获得经编码分量。在此设备中,对于所述组子频带中的至少一者中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。附图说明图1A展示根据一般配置处理音频信号的方法MC100的流程图。图1B展示方法MC100的实施方案MCllO的流程图。图2A说明峰选择窗的实例。图2B展示任务TC200的操作的实例。图2C展示使用级联的残差来以递增频率的次序填充子频带的任一侧上的未被占用的频段的实例。图3展示经MDCT编码的信号的参考帧和目标帧的实例。图4A展示对经编码目标帧进行解码的方法MD100的流程图。图4B展示方法MD100的实施方案MDllO的流程图。图5展示对目标帧进行编码的实例,其中子频带和残差的介入区被标记。图6展示将残差信号的一部分编码为若干单元脉冲的实例。图7A展示根据一般配置的音频信号处理MF100的设备的方框图。图7B展示设备MF100的实施方案MFllO的方框图。图8A展示根据另一一般配置的音频信号处理AlOO的设备的方框图。图8B展示编码器300的实施方案302的方框图。图8C展示设备AlOO的实施方案AllO的方框图。图8D展示设备AlOO的实施方案A120的方框图。图8E展示设备A120的实施方案A130的方框图。图9A展示设备AllO的实施方案A140的方框图。图9B展示设备A120的实施方案A150的方框图。图1OA展示根据一般配置的音频信号处理MFD100的设备的方框图。图1OB展示设备MFD100的实施方案MFDllO的方框图。图1OC展示根据另一一般配置的音频信号处理A100D的设备的方框图。图1lA展示设备A100D的实施方案AllOD的方框图。图1lB展示设备AllOD的实施方案A120D的方框图。图1lC展示根据一般配置的设备A200的方框图。图12展示可结合方法MC100执行的音频信号处理的方法MBllO的流程图。图13展示针对其中UB-MDCT信号正被建模的实例的量值对频率的曲线图。图14A到E展示用于设备A120的各种实施方案的应用的范围。图15A展示信号分类的方法MZ100的方框图。图15B展示通信装置DlO的方框图。图16展示手持机HlOO的前视图、后视图和侧视图。具体实施例方式可使用本文中所描述的动态子频带选择方案来匹配将要用先前帧的对应的感知上重要的子频带编码的帧的感知上重要的(例如,高能量)子频带。可能需要识别将要编码的信号内的显著能量的区。将此些区与信号的其余部分分离实现对这些区的对准目标的译码以用于增加的译码效率。举例来说,可能需要通过使用相对更多的位来对此些区进行编码且使用相对较少的位(或甚至不使用位)对信号的其它区进行编码来增加译码效率。对于具有谐波内容的音频信号(例如,音乐信号、有声的语音信号),在给定时间处在频域中的显著能量的区的位置可在时间上相对持久。可能需要通过利用此时间上的相关性来执行对音频信号的高效变换域译码。本文中所描述的用于对表示信号的音频-频率范围的一组变换系数进行译码的方案通过相对于如经解码的早先帧中的此些区的位置来对频域中的显著能量的区的位置进行编码而利用信号频谱上的能量分布的时间持续性。在一特定应用中,使用此方案来对对应于音频信号的OkHz到4kHz范围(此后称作低频带MDCT或LB-MDCT)的MDCT变换系数(例如,线性预测译码(LPC)操作的残差)进行编码。将显著能量的区的位置与其内容分离允许使用最小侧信息(例如,与经编码信号的先前帧中的那些区的位置的偏移)来表示将要传输本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.07.30 US 61/369,662;2010.07.31 US 61/369,705;1.一种音频信号处理方法,所述方法包括在经配置以处理音频信号的帧的装置中执行以下动作中的每一者在频域中定位描述所述音频信号的帧的参考帧中的多个能量集中;针对所述多个频域能量集中中的每一者且基于所述集中的位置,选择所述音频信号的目标帧内的位置以用于所述目标帧的一组子频带中的对应一者,其中所述目标帧在所述音频信号中在由所述参考帧描述的所述帧之后;以及与所述目标帧的不在所述组子频带中的任一者中的样本分开地对所述目标帧的所述组子频带进行编码以获得经编码分量,其中对于所述组子频带中的至少一者中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。2.根据权利要求1所述的方法,其中所述参考帧中的所述多个能量集中中的每一者是峰。3.根据权利要求1和2中任一权利要求所述的方法,其中所述选择所述位置包括在包含所述集中的所述位置的多个候选者中选择一个候选者。4.根据权利要求1到3中任一权利要求所述的方法,其中所述目标帧的不在所述组子频带中的任一者中的所述样本包含位于所述组子频带的邻近者之间的样本。5.根据权利要求1到4中任一权利要求所述的方法,其中所述方法包括对经编码信号进行解量化以获得所述参考帧。6.根据权利要求1到5中任一权利要求所述的方法,其中所述编码包含对所述组子频带中的至少一者执行增益-形状向量量化操作。7.根据权利要求1到6中任一权利要求所述的方法,其中所述音频信号是基于线性预测译码残差。8.根据权利要求1到7中任一权利要求所述的方法,其中所述目标帧是多个修正型离散余弦变换系数。9.根据权利要求1到8中任一权利要求所述的方法,其中对于所述组子频带中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。10.根据权利要求1到9中任一权利要求所述的方法,其中对于所述组子频带中的至少一者,所述选择所述子频带的所述位置包含选择对应的抖动值。11.根据权利要求1到10中任一权利要求所述的方法,其中所述方法包括产生经编码帧,所述经编码帧包含(A)所述经编码分量和(B)所述目标帧的不在所述组子频带中的任一者中的样本的经排序的一连串值的表示。12.根据权利要求1到10中任一权利要求所述的方法,其中所述方法包括对所述经编码分量进行解码以获得一组经解码子频带;从所述目标帧减去所述组经解码子频带以获得残差;对所述残差进行编码以获得经编码残差;以及产生包含(A)所述经编码分量和(B)所述经编码残差的经编码帧。13.根据权利要求1到12中任一权利要求所述的方法,其中所述方法包括通过根据预定分割方案将所述帧的所述样本分组到第二组子频带中而对所述目标帧进行编码以获得第二经编码帧;以及使用感知度量在所述经编码帧与所述第二经编码帧中选择一者。14.一种构建经解码音频帧的方法,所述方法包括在频域中定位描述音频信号的帧的参考帧中的多个能量集中;对来自经编码目标帧的信息进行解码以获得多个子频带中的每一者的经解码内容和抖动值;以及根据所述对应的抖动值和所述多个位置中的对应一者来放置每一子频带的所述经解码内容以获得经解码目标帧。15.根据权利要求14所述的方法,其中所述方法包括对经编码信号进行解量化以获得所述参考中贞。16.一种用于处理音频信号的帧的设备,所述设备包括用于在频域中定位描述所述音频信号的帧的参考帧中的多个能量集中的装置;用于针对所述多个频域能量集中中的每一者且基于所述集中的位置来选择所述音频信号的目标帧内的位置以用于所述目标帧的一组子频带中的对应一者的装置,其中所述目标帧在所述音频信号中在由所述参考帧描述的所述帧之后;以及用于与所述目标帧的不在所述组子频带中的任一者中的样本分开地对所述目标帧的所述组子频带进行编码以获得经编码分量的装置,其中对于所述组子频带中的至少一者中的每一者,所述经编码分量包含在所述频域中在所述子频带的所述选定位置与所述对应集中的所述位置之间的距离的指示。17.根据权利要求16所述的设备,其中所述参考帧中的所述多个能量集中中的每一者是峰。18.根据权利要求16和17中任一权利要求所述的设备,其中所述用于选择所述位置的装置包括用于在包含所述集中的所述位置的多个候选者中选择一个候选者的装置。19.根据权利要求16到18中任一权利要求所述的设备,其中所述...

【专利技术属性】
技术研发人员:文卡特什·克里希南维韦克·拉金德朗伊桑·R·杜尼
申请(专利权)人:高通股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1