本发明专利技术提供了一种编码方法和装置以及一种解码方法和装置。该解码方法包括:从输入比特流提取缩减混音信号和缩减混音标识信息;基于该缩减混音标识信息确定缩减混音信号是否是通过执行三维(3D)渲染操作获取的3D缩减混音信号;并且如果缩减混音信号不是3D缩减混音信号,则通过执行3D渲染操作生成3D缩减混音信号。因此,高效率地编码具有3D效果的多声道信号,并根据音频再现环境的特性以最优音质自适应地恢复和再现音频信号是可能的。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及编码/解码方法和编码/解码装置,尤其涉及可处理音频信号使得能够产生三维(3D)音响效果的编码/解码装置,以及利用该编码/解码装置的编码/解码方法。
技术介绍
编码装置将多声道信号缩减混音成具有较少声道的信号,并将经缩减混音的信号传送到解码装置。然后,解码装置从经缩减混音的信号恢复多声道信号,并使用如5.1声道扬声器之类的三个或更多扬声器再现所恢复的多声道信号。 多声道信号可由诸如耳机之类的2声道扬声器来再现。在这种情况下,为了使用户觉得由2声道扬声器输出的声音好像从三个或更多声源再现的一样,有必要开发出能够编码或解码多声道信号使得能够产生3D效果的三维(3D)处理技术。
技术实现思路
技术问题 本专利技术提供一种能够通过高效率地处理具有3D效果的信号而在各种再现环境中再现多声道信号的编码/解码装置以及编码/解码方法。 技术解决方案 根据本专利技术的一个方面,提供了一种解码音频信号的解码方法,该解码方法包括从输入比特流提取缩减混音信号和缩减混音标识信息;基于该缩减混音标识信息确定缩减混音信号是否是通过执行三维(3D)渲染操作获取的3D缩减混音信号;并且如果缩减混音信号不是3D缩减混音信号,则通过执行3D渲染操作生成3D缩减混音信号。 根据本专利技术的另一个方面,提供了一种编码具有多个声道的多声道信号的编码方法,该编码方法包括将多声道信号编码成具有较少声道的缩减混音信号;生成关于多个声道的空间信息;通过执行3D渲染操作生成3D缩减混音信号;并利用缩减混音信号和3D缩减混音信号中的至少一个和空间信息生成比特流。 根据本专利技术的另一个方面,提供了一种解码音频信号的解码装置,该解码装置包括比特拆分单元,其从输入比特流提取经编码的缩减混音信号和缩减混音标识信息;缩减混音解码器,其对经编码的缩减混音信号进行解码;以及3D渲染单元,其基于缩减混音标识信息确定由缩减混音解码器执行解码获取的缩减混音信号是否是通过执行三维(3D)渲染操作获取的3D缩减混音信号,并且如果由缩减混音解码器执行解码获取的缩减混音信号不是3D缩减混音信号,则通过执行3D渲染操作生成3D缩减混音信号。 根据本专利技术的另一个方面,提供了一种编码具有多个声道的多声道信号的编码装置,该编码装置包括多声道编码器,其将多声道信号编码成具有较少声道的缩减混音信号并生成关于多个声道的空间信息;3D渲染单元,其通过对缩减混音信号执行3D渲染操作来生成3D缩减混音信号;比特打包单元,其生成包括缩减混音信号和3D缩减混音信号中的至少一个、空间信息以及指示缩减混音信号和3D缩减混音信号中的哪一个被包括在比特流中的缩减混音标识信息的比特流。 根据本专利技术的另一个方面,提供了一种具有用于执行上述的解码方法或上述的编码方法的计算机程序的计算机可读记录介质。 根据本专利技术的另一个方面,提供了一种比特流,该比特流包括数据字段,其包括缩减混音信号和3D缩减混音信号中的至少一个;滤波器信息字段,其包括标识用于生成3D缩减混音信号的滤波器的滤波器信息;报头字段,其包括指示缩减混音信号和3D缩减混音信号中的哪一个被包括在该比特流中的缩减混音标识信息;以及空间信息字段,其包括关于多个声道的空间信息。 有益效果 根据本专利技术,可高效地编码具有3D效果的多声道信号,并根据再现环境的特性以最优音质自适应地恢复和再现音频信号。 附图简要说明 附图说明图1是根据本专利技术的实施例的编码/解码装置的框图; 图2是根据本专利技术的实施例的编码装置的框图; 图3是根据本专利技术的实施例的解码装置的框图; 图4是根据本专利技术的另一个实施例的编码装置的框图; 图5是根据本专利技术的另一个实施例的解码装置的框图; 图6是根据本专利技术的另一个实施例的解码装置的框图; 图7是根据本专利技术的实施例的三维(3D)渲染装置的框图; 图8至11示出根据本专利技术的实施例的比特流; 图12是根据本专利技术的实施例用于处理任意缩减混音信号的编码/解码装置的框图; 图13是根据本专利技术的实施例的任意缩减混音信号补偿/3D渲染单元的框图; 图14是根据本专利技术的实施例用于处理兼容缩减混音信号的解码装置的框图; 图15是根据本专利技术的实施例的缩减混音兼容性处理/3D渲染单元的框图;以及 图16是根据本专利技术的实施例用于消除串扰的解码装置的框图。 本专利技术的最佳实施方式 下文中将参考示出本专利技术的示例性实施例的附图更全面地描述本专利技术。图1是根据本专利技术的实施例的编码/解码装置的框图。参考图1,编码单元100包括多声道编码器110、三维(3D)渲染单元120、缩减混音编码器130以及比特打包单元140 多声道编码器110将具有多个声道的多声道信息缩减混音成诸如立体声或单声道信号之类的缩减混音信号,并生成关于该多声道信号的声道的空间信息。需要空间信息是为了从缩减混音信号恢复多声道信号。 空间信息的例子包括指示一对声道的能级之差的声道电平差(CLD)、声道预测系数(CPC)——即用于基于2声道信号生成3声道信号的预测系数、指示一对声道之间的相关性的声道间相关性(ICC)以及一对声道之间的时间间隔的声道时间差(CTD)。 3D渲染单元120基于缩减混音信号生成3D缩减混音信号。3D缩减混音信号可以是具有三个或更多方向性的2声道信号,因此可由诸如耳机之类的2声道扬声器再现并具有3D效果。换言之,3D缩减混音信号可由2声道扬声器再现,使得用户觉得3D缩减混音信号好像是从具有三个或更多声道的声源再现的一样。声源的方向可基于分别输入到两耳的两个声音的强度之差、两个声音之间的时间间隔以及两个声音的相位之差中的至少一个来确定。因此,3D渲染单元120可基于人类如何利用其听觉确定声源的3D位置来将缩减混音信号转换成3D缩减混音信号。 3D渲染单元120可通过利用滤波器滤波缩减混音信号来生成3D缩减混音信号。在这种情况下,可由外部源将滤波器相关信息——如滤波器系数输入到3D渲染单元120。3D渲染单元120可利用由多声道编码器110提供的空间信息来基于缩减混音信号生成3D缩减混音信号。更具体地,3D渲染单元120可通过利用空间信息将缩减混音信号转换成想像的多声道信号并滤波该想像的多声道信号来将缩减混音信号转换成3D缩减混音信号。 3D渲染单元120可通过利用报头相关传递函数(HRTF)滤波器滤波缩减混音信号来生成3D缩减混音信号。 HRTF是一种传递函数,它描述任意位置的声源和耳膜之间声波的传输,并返回根据声源的方向和高度变化的值。如果利用HRTF滤波没有方向性的信号,则可听到该信号好像从某方向再现一样。 3D渲染单元120可在例如离散傅立叶变换(DFT)域或快速傅立叶变换(FFT)域之类的频域中执行3D渲染操作。在这种情况下,3D渲染单元120可在3D渲染操作前执行DFT或FFT,或者可在3D渲染操作后执行逆DFT(IDFT)或逆FFT(IFFT)。 3D渲染单元120可在正交镜像滤波器(QMF)/混合域中执行3D渲染操作。在这种情况下,3D渲染单元120可在3D渲染操作之前或之后执行QMF/混合分析和合成操作。 3D渲染单元120可在时域中执行3D渲染操作。3D渲染单元120可根据所需的音质和编码/解码装置的本文档来自技高网...
【技术保护点】
一种解码音频信号的解码方法,所述解码方法包括: 从输入比特流提取缩减混音信号和缩减混音标识信息; 基于所述缩减混音标识信息确定所述缩减混音信号是否是通过执行三维(3D)渲染操作获取的3D缩减混音信号;以及 如果所述缩减混音信号不是3D缩减混音信号,则通过执行3D渲染操作生成3D缩减混音信号。
【技术特征摘要】
【国外来华专利技术】US 2006-2-7 60/765,747;US 2006-2-9 60/771,471;US 21.一种解码音频信号的解码方法,所述解码方法包括从输入比特流提取缩减混音信号和缩减混音标识信息;基于所述缩减混音标识信息确定所述缩减混音信号是否是通过执行三维(3D)渲染操作获取的3D缩减混音信号;以及如果所述缩减混音信号不是3D缩减混音信号,则通过执行3D渲染操作生成3D缩减混音信号。2.如权利要求1所述的解码方法,其特征在于,还包括利用所述缩减混音信号和关于多个声道的空间信息生成多声道信号。3.如权利要求1所述的解码方法,其特征在于,还包括解码所述提取的缩减混音信号。4.如权利要求1所述的解码方法,其特征在于,所述生成包括利用报头相关传递函数(HRTF)。5.如权利要求1所述的解码方法,其特征在于,还包括如果所述缩减混音信号是3D缩减混音信号,则通过执行3D渲染操作来从所述缩减混音信号去除3D效果。6.如权利要求5所述的解码方法,其特征在于,还包括利用通过所述去除获取的缩减混音信号和关于多个声道的空间信息生成多声道信号。7.如权利要求5所述的解码方法,其特征在于,所述去除包括使用用于生成所述缩减混音信号的HRTF的反函数。8.如权利要求1所述的解码方法,其特征在于,所述生成包括在离散傅立叶变换(DFT)域、快速傅立叶变换(FFT)域、正交镜像滤波器(QMF)/混合域和时域之一中执行所述3D渲染操作。9.一种编码具有多个声道的多声道信号的编码方法,所述编码方法包括将所述多声道信号编码成具有较少声道的缩减混音信号;生成关于所述多个声道的空间信息;通过执行3D渲染操作生成3D缩减混音信号;以及利用所述缩减混音信号和所述3D缩减混音信号中的至少一个和所述空间信息生成比特流。10.如权利要求9所述的编码方法,其特征在于,所述比特流包括指示在所述比特流中包括所述缩减混音信号和所述3D缩减混音信号中的哪一个的信息。11.如权利要求9所述的编码方法,其特征在于,所述3D缩减混音信号的生成包括使用HRTF。12.如权利要求11所述的编码方法,其特征在于,所述比特流包括关于所述HETF的系...
【专利技术属性】
技术研发人员:郑亮源,房熙锡,吴贤午,金东秀,林宰显,
申请(专利权)人:LG电子株式会社,
类型:发明
国别省市:KR[韩国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。