实现低复杂度格式转换的内部声道处理方法和装置制造方法及图纸

技术编号:17415956 阅读:102 留言:0更新日期:2018-03-07 11:05
根据本发明专利技术实施例的处理音频信号的方法包括如下步骤:接收通过MPEG环绕212(MPS212)编码的音频比特流;基于接收到的音频比特流以及在格式转换器中定义的用于MPS212输出声道的渲染参数中的均衡(EQ)值和增益值,生成用于一个双声道单元(CPE)的内部声道信号;以及,基于所产生的内部声道信号生成立体声输出信号。

Internal channel processing method and device for realizing low complexity format conversion

According to the method of processing an audio signal of the embodiment of the invention comprises the following steps: receiving around 212 by MPEG (MPS212) encoding audio bit stream; rendering parameters received by the audio bit stream and used to define the format converter in MPS212 output channels (EQ) based on the equilibrium value and gain value for a generation a dual channel unit (CPE) of the internal channel signal; and internal channel stereo output signal is generated based on the generated signal.

【技术实现步骤摘要】
【国外来华专利技术】实现低复杂度格式转换的内部声道处理方法和装置
本专利技术涉及实现低复杂度格式转换的内部声道(IC)处理方法和装置,更具体地说,涉及一种通过在立体输出布局环境中对输入声道执行IC处理以减少格式转换器中的IC数量进而减少在格式转换器中进行的协方差运算次数的方法和装置。
技术介绍
根据MPEG-H3D音频,可以处理各种类型的信号并且可以容易地控制输入/输出的类型。因此,MPEG-H3D音频可以用作下一代音频信号处理的解决方案。此外,根据装置小型化的趋势,在立体声再现环境中借助于移动设备进行音频再现的百分比已经增加。当通过诸如22.2声道的多声道实现的沉浸式音频信号被传送到立体声再现系统时,将要解码所有输入声道,并且沉浸式音频信号要被缩混(downmix)以转换成立体声格式。随着输入声道数量的增加和输出声道数量的减少,在上述过程中,协方差分析和相位对齐所需的解码器的复杂度增加。这种复杂度的增加不仅影响移动设备的运行速度,还影响移动设备的电池消耗。
技术实现思路
技术问题如上所述,增加输入声道的数量以提供沉浸式音频,然而减少输出声道的数量以实现便携性。在这种环境下,解码过程中格式转换的复杂度成为问题。为了解决这个问题,本专利技术提供了解码器中格式转换的复杂度的降低。技术方案为了实现上述目标,本专利技术的代表性特征如下。根据本专利技术的一个方面,提供了一种处理音频信号的方法,所述方法包括:接收通过MPEG环绕212(MPS212)编码的音频比特流;基于接收到的音频比特流、格式转换器中定义的MPS212输出声道的均衡(EQ)值和MPS212输出声道的增益值,生成用于单个双声道单元(CPE)的内部声道(IC)信号;以及基于生成的IC信号生成立体声输出信号。所述IC信号的生成可以包括:基于包含在MPS212有效载荷中的声道电平差(CLD),将所述接收到的音频比特流上混(upmix)为用于包含在所述单个CPE中的声道对的信号;基于所述EQ值和所述增益值,缩放上混后的比特流;以及混合缩放后的比特流。所述IC信号的生成可以进一步包括判定是否生成了所述用于单个CPE的IC信号。可以基于包含在单个CPE中的声道对是否属于同一个IC组,来判定是否生成所述用于单个CPE的IC信号。当包含在单个CPE中的声道对均包含在左IC组中时,所述IC信号可以只通过立体声输出声道中的左输出声道输出。当包含在单个CPE中的声道对均包含在右IC组中时,所述IC信号可以只通过立体声输出声道中的右输出声道输出。当包含在单个CPE中的声道对均包含在中央IC组中或者包含在单个CPE中的声道对均包含在低频音效(LFE)IC组中时,所述IC信号可以通过立体声输出声道中的左输出声道和右输出声道均匀地输出。所述音频信号可以是沉浸式音频信号。所述IC信号的生成还可以包括:计算IC增益(ICG);以及应用所述ICG。根据本专利技术的另一方面,提供了一种用于处理音频信号的装置,所述装置包括:接收器,被配置为接收通过MPEG环绕212(MPS212)编码的音频比特流;内部声道(IC)信号发生器,被配置为基于接收到的音频比特流、格式转换器中定义的MPS212输出声道的均衡(EQ)值和MPS212输出声道的增益值,生成用于单个双声道单元(CPE)的IC信号;以及立体声输出信号发生器,被配置为基于生成的IC信号生成立体声输出信号。所述IC信号发生器可以被配置为:基于包含在MPS212有效载荷中的声道电平差(CLD),将所述接收到的音频比特流上混为用于包含在所述单个CPE中的声道对的信号;基于所述EQ值和所述增益值,缩放上混后的比特流;以及混合缩放后的比特流。所述IC信号发生器可以被配置为判定是否生成了所述的用于单个CPE的IC信号。可以基于包含在单个CPE中的声道对是否属于同一个IC组,来判定是否生成所述IC信号。当包含在单个CPE中的声道对均包含在左IC组中时,所述IC信号可以只通过立体声输出声道中的左输出声道输出。当包含在单个CPE中的声道对均包含在右IC组中时,所述IC信号可以只通过立体声输出声道中的右输出声道输出。当包含在单个CPE中的声道对均包含在中央IC组中或者包含在单个CPE中的声道对均包含在低频音效(LFE)IC组中时,所述IC信号可以通过立体声输出声道中的左输出声道和右输出声道均匀地输出。所述音频信号可以是沉浸式音频信号。所述IC信号发生器可以被配置为计算IC增益(ICG)和应用所述ICG。根据本专利技术的另一个方面,提供了一种计算机可读记录介质,所述计算机可读记录介质上记录有用于执行前述的方法的计算机程序。根据本专利技术的其他实施例,提供了其它方法、其它系统和上面记录有用于执行所述方法的计算机程序的计算机可读记录介质。有益效果根据本专利技术,通过使用内部声道(IC)减少了输入到格式转换器的声道的数量,因此可以降低格式转换器的复杂度。更详细地说,由于减少了输入到格式转换器的声道数量,所以简化了要在格式转换器中执行的协方差分析,因此,降低了格式转换器的复杂度。附图说明图1是根据一个实施例的用于将24个输入声道格式转换为立体声输出声道的解码结构的框图。图2是根据一个实施例的解码结构的框图,该解码结构利用13个内部声道(IC)将22.2声道沉浸式音频信号格式转换为立体声输出声道。图3图示了从单个双声道单元(CPE)生成单个IC的实施例。图4是根据本专利技术实施例的解码器的IC增益(ICG)应用单元将ICG应用于IC信号的详细框图。图5是示出了根据本专利技术实施例的编码器预处理ICG时的解码的框图。图6的流程图示出了根据本专利技术实施例的当通过立体声再现布局输出CPE时执行单声道频段复制(SBR)解码然后执行MPEG环绕(MPS)解码的结构中的IC处理方法。图7的流程图示出了根据本专利技术实施例的当通过立体声再现布局输出CPE时执行MPS解码并随后执行立体声SBR解码的结构中的IC处理方法。图8是根据本专利技术实施例的当通过立体声再现布局输出四声道单元(QCE)时使用立体声SBR的结构中的IC处理方法的框图。图9是根据本专利技术另一实施例的在通过立体声再现布局输出QCE时使用立体声SBR的结构中的IC处理方法的框图。图10a示出了当第一包络的开始边界相同并且最后包络的停止边界相同时确定时间包络格子的实施例。图10b示出了当第一包络的开始边界不同并且最后包络的停止边界相同时确定时间包络格子的实施例。图10c示出了当第一包络的开始边界相同并且最后包络的停止边界不同时确定时间包络格子的实施例。图10d示出了当第一包络的开始边界不同并且最后包络的停止边界不同时确定时间包络格子的实施例。表1示出了将22.2声道沉浸式音频信号渲染为立体声信号的格式转换器的混合矩阵的实施例。表2示出了使用IC将22.2声道沉浸式音频信号渲染为立体声信号的格式转换器的混合矩阵的实施例。表3示出了根据本专利技术实施例的使用IC来配置22.2声道的CPE结构。表4示出了根据本专利技术实施例的与解码器输入声道对应的IC的类型。表5示出根据本专利技术实施例的根据IC类型另外定义的声道的位置。表6示出根据本专利技术的实施例的与IC类型对应的格式转换器输出声道,以及将被应用于每个格式转换器输出声道的增益和EQ索引。表7示出了根据本专利技术实施例的ICGConfig的句法。表8示本文档来自技高网...
实现低复杂度格式转换的内部声道处理方法和装置

【技术保护点】
一种处理音频信号的方法,所述方法包括:接收通过MPEG环绕212(MPS212)编码的音频比特流;基于接收到的音频比特流、格式转换器中定义的MPS212输出声道的均衡(EQ)值和MPS212输出声道的增益值,生成用于单个双声道单元(CPE)的内部声道(IC)信号;以及基于生成的IC信号生成立体声输出信号。

【技术特征摘要】
【国外来华专利技术】2015.06.17 US 62/181,096;2015.10.13 US 62/241,082;1.一种处理音频信号的方法,所述方法包括:接收通过MPEG环绕212(MPS212)编码的音频比特流;基于接收到的音频比特流、格式转换器中定义的MPS212输出声道的均衡(EQ)值和MPS212输出声道的增益值,生成用于单个双声道单元(CPE)的内部声道(IC)信号;以及基于生成的IC信号生成立体声输出信号。2.如权利要求1所述的方法,其中,所述IC信号的生成包括:基于包含在MPS212有效载荷中的声道电平差(CLD),将所述接收到的音频比特流上混为用于包含在所述单个CPE中的声道对的信号;基于所述EQ值和所述增益值,缩放上混后的比特流;以及混合缩放后的比特流。3.如权利要求1所述的方法,其中,所述IC信号的生成进一步包括判定是否生成了所述用于单个CPE的IC信号。4.如权利要求3所述的方法,其中,基于包含在单个CPE中的声道对是否属于同一个IC组,来判定是否生成所述用于单个CPE的IC信号。5.如权利要求4所述的方法,其中,当包含在单个CPE中的声道对均包含在左IC组中时,所述IC信号只通过立体声输出声道中的左输出声道输出,并且当包含在单个CPE中的声道对均包含在右IC组中时,所述IC信号只通过立体声输出声道中的右输出声道输出。6.如权利要求4所述的方法,其中,当包含在单个CPE中的声道对均包含在中央IC组中或者包含在单个CPE中的声道对均包含在低频音效(LFE)IC组中时,所述IC信号通过立体声输出声道中的左输出声道和右输出声道均匀地输出。7.如权利要求1所述的方法,其中,所述IC信号的生成包括:计算IC增益(ICG);以及应...

【专利技术属性】
技术研发人员:金善民孙尚模
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1