编码装置、解码装置、编码方法、以及解码方法制造方法及图纸

技术编号:11374275 阅读:84 留言:0更新日期:2015-04-30 11:33
带宽扩展参数生成装置(306)具有:抽出部(303),抽出表示输入声音信号的高频带部分的高频带信号;以及计算部(304),计算表示高频带信号中的音调成分的能量的大小的音调参数、和表示高频带信号中的除了音调成分之外的成分即基底成分的能量的大小的基底参数。

【技术实现步骤摘要】
【国外来华专利技术】编码装置、解码装置、编码方法、以及解码方法
本专利技术涉及声音信号的编码装置及解码装置等,尤其涉及声音信号的编码及解码中的带宽扩展(bandwidthextension)技术。
技术介绍
一般来说,在声音信号(语音信号及音频信号)的编码中,使用核心编码工具(corecodingtool)和参量编码工具(parametriccodingtool)这两种工具。作为参量编码工具之一的带宽扩展工具(BWE工具),在MPEGUSAC(非专利文献2)等技术中,已知有上复制(copy-up)方法和谐波(harmonic)方法。现有技术文献非专利文献非专利文献1:Carot,Alexander,etal“NetworkedMusicPerformance:StateoftheArt”,AES30thInternationalConference,2007March15-17非专利文献2:Neuendorf,etal,“MPEGUnifiedSpeechandAudioCoding-TheISO/MPEGStandardforHigh-EfficiencyAudioCodingofallContentTypes”,AES132ndConvention,2012April26-29.非专利文献3:Sinha,etal,“ANovelIntegratedAudioBandwidthExtensionToolkit(ABET)”,AES120thConvention,2006,May20-23.非专利文献4:ShuixianChen,etal,“EstimatingSpatialCuesforAudioCodinginMDCTDomain”,IEEEInternationalConferenceonMultimediaandExpo,2009,June28-July3非专利文献5:Daudet,Sandler,“MDCTAnalysisofSinusoids:ExactResultsandApplicationstoCodingArtifactsReduction”,IEEETransactionsonSpeechandAudioProcessing,Vol.12,No.3,May2004.
技术实现思路
专利技术要解决的课题上复制方法是复制低频部分的频谱而生成高频部分的频谱的简单方法。在上复制方法中,存在无法正确保持两个频谱间的谐波关系的课题。即,音质是课题。另一方面,谐波方法是通过将低频部分的频谱谐波地拉伸(stretch),并且切割出来,生成高频部分的频谱的方法。在谐波方法中,由于处理复杂,因此其课题在于延迟时间长这一点和需要大容量存储器这一点上。于是,本专利技术提供使用了新的带宽扩展方法的带宽扩展参数生成装置等。用于解决课题的手段本专利技术的一个方式的带宽扩展参数生成装置具有:提取部,提取表示输入声音信号的高频带部分的高频带信号;以及计算部,计算音调参数和基底参数,所述音调参数表示所述高频带信号中的音调成分的能量的大小,所述基底参数表示所述高频带信号中的除了所述音调成分之外的成分即基底成分的能量的大小。另外,这些概括性的或者具体的方式也可以以系统、方法、集成电路、计算机程序或者计算机可读的CD-ROM等记录介质来实现,还可以以系统、方法、集成电路、计算机程序及记录介质的任意组合来实现。专利技术效果根据本专利技术的带宽扩展参数生成装置等,能够抑制延迟时间及使用存储器,并且使高音质的带宽扩展成为可能。附图说明图1是用于说明上复制方法(图1的(a))和谐波方法(图1的(b))的示意图。图2是表示USAC的解码器中的两个BWE模式的框图。图3是表示实施方式1的编码装置的功能结构的框图。图4是实施方式1的编码装置的动作的流程图。图5是表示时间间隙(timeslot)与参数间隙(parameterslot)的关系、以及子带与参数频带的关系的图。图6是表示实施方式2的解码装置的功能结构的框图。图7是实施方式2的解码装置的动作的流程图。图8是表示实施方式3的编码装置的功能结构的框图。图9是实施方式3的编码装置的动作的流程图。图10是表示调帧器的成帧动作及窗处理动作的图。图11是表示MDCT区域、MDST区域、以及复数区域的各个区域中的纯粹的音调的能量的图。图12是表示实施方式4的解码装置的功能结构的框图。图13是实施方式4的解码装置的动作的流程图。具体实施方式(作为本申请的基础的见解)在声音信号(语音信号及音频信号)的编码中,一般使用参量编码工具和核心编码工具这至少两种工具。首先,对参量编码工具进行说明。参量编码工具进行以维持输入声音信号(以下,有时记载为输入信号、原信号或编码对象的信号)的感知性特征来进行重构为目的的编码。通过该编码,输入信号的感知性特征通过以低比特率编码得到的少数参数来表示。将由参量编码工具编码后的信号进行解码而得到的信号、即重构信号,虽然能够在感知性上维持输入信号的品质,但重构信号的波形与输入信号的波形并不类似。作为参量编码工具,例举如带宽扩展工具和多声道扩展工具。带宽扩展工具通过利用信号的高频部分与低频部分的谐波关系,将信号的高频部分参量化地进行编码。作为通过带宽扩展工具的编码而生成的参数(带宽扩展参数)的例子,例如子带能量和音调噪声比(tone-to-noiseratio)。带宽扩展参数在频谱地扩展后的高频部分的信号的振幅的形成中使用。通过在解码器中修补或者拉伸而将低频部分扩展,由此形成高频部分的信号。另外,在解码器中,适当校正基底噪声及音质等。虽然作为结果而得到的输出信号的波形与输入信号的波形不类似,但输出信号在感知性方面与输入信号相似。HE-AAC就是包含这样的带宽扩展工具及频谱频带复制(SBR)的编解码器。在SBR中,在使用正交镜像滤波器组(QMF)而生成的时间频率混合区域中进行参数计算。ITU-TG.718也是具有带宽扩展工具的编解码器,但在ITU-TG.718中,参数计算是在改进离散余弦变换(MDCT,ModifiedDiscreteCosineTransform)区域中进行的。多声道扩展工具将多声道信号下混合(downmix)到编码用的声道子集。结果是,各个声道间的关系被参量化地编码。作为通过多声道扩展工具的编码而生成的参数的例子,例如声道间电平差、声道间时间差、以及声道间相关。在解码器中,通过将解码完成的下混合声道和人工生成的“非相关”信号混合,来合成各个声道。混合的权重(weights)基于上述参数计算出。MPEG环绕(MPS)是多声道扩展工具的应用例。接着,对核心编码工具进行说明。核心编码工具与参量编码工具相对照地,进行以维持输入信号的波形特征来进行重构为目的的编码。核心编码工具通常适用于人类的耳朵反应最敏感的频谱的低频部分。核心编码工具大致分为音频编解码器和语音编解码器这两种。音频编解码器适用于对包含被局部化的频谱成分的稳定信号(例如,音调信号或高次谐波信号)进行编码。在音频编解码器中,编码主要是在频率区域进行的。音频编解码器的编码使用时间/频率变换及MDCT将信号变换到频率(频谱)区域。在MDCT时,部分重合的帧被实施窗处理。帧的部分重合是为了在解码器中实施相邻的帧间的平滑化机理而设置的。在窗处理中本文档来自技高网
...

【技术保护点】
一种带宽扩展参数生成装置,具有:抽出部,抽出表示输入声音信号的高频带部分的高频带信号;以及计算部,计算音调参数和基底参数,所述音调参数表示所述高频带信号中的音调成分的能量的大小,所述基底参数表示所述高频带信号中的除了所述音调成分之外的成分即基底成分的能量的大小。

【技术特征摘要】
【国外来华专利技术】2013.01.22 JP 2013-0096521.一种编码装置,具有处理器,所述处理器从输入声音信号抽出表示所述输入声音信号的高频带部分的高频带信号;计算音调参数和基底参数,所述音调参数表示所述高频带信号中的音调成分的能量的大小,所述基底参数表示所述高频带信号中的除了所述音调成分之外的成分即基底成分的能量的大小;将表示除了所述高频带部分之外的所述输入声音信号的信号编码为核心参数;生成并输出包含所述音调参数、所述基底参数和所述核心参数的比特流,所述处理器还生成将所述输入声音信号进行改进离散余弦变换MDCT处理后得到的MDCT信号;生成将所述输入声音信号进行改进离散正弦变换MDST处理后得到的MDST信号;从所述MDCT信号及所述MDST信号生成复数信号,将生成的所述复数信号的高频带部分作为所述高频带信号抽出;将除去与所述输入声音信号的所述高频带部分对应的部分之后的所述MDCT信号编码为核心参数。2.如权利要求1所述的编码装置,所述处理器还生成除了所述高频带部分之外的所述输入声音信号即窄频带信号;将所述输入声音信号变换为子带信号;将所述子带信号的高频带部分即HF子带信号作为所述高频带信号抽出;将所述窄频带信号编码为所述核心参数。3.一种解码装置,对比特流进行解码,在所述比特流中,包含核心参数、音调参数和基底参数,所述核心参数是已编码的输入声音信号的低频带部分,所述音调参数表示高频带信号之中的音调成分的能量的大小,所述基底参数表示所述高频带信号中的除了所述音调成分之外的成分即基底成分的能量的大小,其中,所述高频带信号表示所述输入声音信号的高频带部分,所述解码装置具有处理器,所述处理器通过解码所述核心参数而生成解码完成窄频带信号;生成低频带音调信号和低频带基底信号,所述低频带音调信号是表示所述解码完成窄频带信号的音调成分的信号,所述低频带基底信号是表示所述解码完成窄频带信号的基底成分的信号;使用所述低频带音调信号生成与所述高频带信号的音调成分对应的信号即高频带音调信号;使用所述低频带基底信号生成与所述高频带信号的基底成分对应的信号即高频带基底信号;生成使用所述音调参数将所述高频带音调信号调整后得到的调整完成音调信号;生成使用所述基底参数将所述高频带基底信号调整后得到的调整完成基底信号;生成将从所述核心参数获得的信号、所述调整完成音调信号和所述调整完成基底信号相加后得到的带宽扩展信号,所述处理器还解码所述核心参数并生成MDCT信号;生成将所述MDCT信号变换到MDST区域后得到的MDST信号;将从生成的所述MDCT信号及所述MDST信号得到的复数信号作为所述解码完成窄频带信号而生成;生成将从所述核心参数获得的信号即所述MDCT信号、所述调整完成音调信号和所述调整完成基底信号相加后得到的所述带宽扩展信号。4.如权利要求3所述的解码装置,所述处理器将表示所述低频带音调信号中包含的音调成分的高次谐波成分的信号作为所述高频带音调信号而生成。5.如权利要求3所述的解码装置,所述处理器还将所述解码完成窄频带信号变换为子带信号;通过分割所述子带信号,生成所述低频带音调信号和所述低频带基底信号;生成将从所述核心参数得到的信号即所述子带信号、所述调整完成音调信号和所述调整完成基底信号相加后得到的所述带宽扩展信号。6.如权利要求5所述的解码装置,所述处理器通过从所述低频带音调信号中的子带之中选择音调成分的能量(1)比相邻的子带的音...

【专利技术属性】
技术研发人员:石川智一张国成刘宗宪
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1