低时延低频率效应编译码器制造技术

技术编号:33258648 阅读:16 留言:0更新日期:2022-04-30 23:04
在一些实施方案中,一种对低频率效应(LFE)声道进行编码的方法包括:接收时域LFE声道信号;使用低通滤波器对所述时域LFE声道信号进行滤波;将所述经滤波的时域LFE声道信号转换成所述LFE声道信号的包含表示所述LFE声道信号的频谱的一定数目个系数的频域表示;将系数布置到与所述LFE声道信号的不同频带对应的一定数目个次频带群组中;根据所述低通滤波器的频率响应曲线将每一次频带群组中的系数量化;使用针对所述次频带群组调谐的熵译码器对每一次频带群组中的所述经量化系数进行编码;及产生包含所述经编码的经量化系数的位流;及将所述位流存储于存储装置上或将所述位流流式传输到下游装置。流流式传输到下游装置。流流式传输到下游装置。

【技术实现步骤摘要】
【国外来华专利技术】低时延低频率效应编译码器
[0001]相关申请案的交叉参考
[0002]此申请案主张2019年9月3日申请的美国临时专利申请案第62/895,049号及2020年8月24日申请的美国临时专利申请案第63/069,420号的优先权,上述申请案中的每一者以全文引用的方式并入本文中。


[0003]本专利技术大体来说涉及音频信号处理,且确切来说,涉及处理低频率效应(LFE)声道。

技术介绍

[0004]举例来说,沉浸式服务的标准化努力包含针对声音、多流电传会议、虚拟现实(VR)、用户产生的现场及非现场内容流式传输开发沉浸式声音与音频服务(IVAS)编译码器。IVAS标准的目标是开发音频质量出色、时延低、支持空间音频译码、具有恰当位速率范围、高质量错误恢复及实际实施复杂性的单个编译码器。为实现此目标,期望开发可基于能够进行IVAS的装置或能够处理LFE信号的任何其它装置来处置低时延LFE操作的IVAS编译码器。LFE声道用于范围为20Hz到120Hz的深度低音调声响,且通常发送到经设计以再生低频率音频内容的扬声器。

技术实现思路

[0005]揭示可配置低时延LFE编译码器的实施方案。
[0006]在一些实施方案中,一种对低频率效应(LFE)声道进行编码的方法包括:使用一或多个处理器接收时域LFE声道信号;使用低通滤波器对所述时域LFE声道信号进行滤波;使用所述一或多个处理器将所述经滤波的时域LFE声道信号转换成所述LFE声道信号的包含表示所述LFE声道信号的频谱的一定数目个系数的频域表示;使用所述一或多个处理器将系数布置到与所述LFE声道信号的不同频带对应的一定数目个次频带群组中;使用所述一或多个处理器根据所述低通滤波器的频率响应曲线将每一次频带群组中的系数量化;使用所述一或多个处理器使用针对每一次频带群组调谐的熵译码器对所述次频带群组中的所述经量化系数进行编码;及使用所述一或多个处理器产生包含所述经编码的经量化系数的位流;以及使用所述一或多个处理器将所述位流存储于存储装置上或将所述位流流式传输到下游装置。
[0007]在一些实施方案中,将每一次频带群组中的所述系数量化进一步包括:基于可用量化点的最大数目及所述系数的绝对值的和来产生缩放移位因数;及使用所述缩放移位因数将所述系数量化。
[0008]在一些实施方案中,如果经量化系数超过量化点的所述最大数目,那么将所述缩放移位因数减小且再次将所述系数量化。
[0009]在一些实施方案中,对于每一次频带群组来说,所述量化点是不同的。
[0010]在一些实施方案中,根据精细量化方案或粗略量化方案将每一次频带群组中的所述系数量化,其中与根据所述粗略量化方案指派给一或多个次频带群组的量化点相比,利用所述精细量化方案将更多量化点分配给所述相应次频带群组。
[0011]在一些实施方案中,所述系数的正负号位与所述系数分开译码。
[0012]在一些实施方案中,存在四个次频带群组,且第一次频带群组对应于0Hz到100Hz的第一频率范围,第二次频带群组对应于100Hz到200Hz的第二频率范围,第三次频带群组对应于200Hz到300Hz的第三频率范围,且第四次频带群组对应于300Hz到400Hz的第四频率范围。
[0013]在一些实施方案中,所述熵译码器是算术熵译码器。
[0014]在一些实施方案中,将所述经滤波的时域LFE声道信号转换成所述LFE声道信号的包含表示所述LFE声道信号的频谱的一定数目个系数的频域表示进一步包括:确定所述LFE声道信号的第一步长;基于所述第一步长指定窗函数的第一窗口大小;将所述第一窗口大小应用于所述时域LFE声道信号的一或多个帧;及将修改型离散余弦变换(MDCT)应用于所述经窗口化的帧以产生所述系数。
[0015]在一些实施方案中,所述方法进一步包括:确定所述LFE声道信号的第二步长;基于所述第二步长指定所述窗函数的第二窗口大小;及将所述第二窗口大小应用于所述时域LFE声道信号的所述一或多个帧。
[0016]在一些实施方案中,所述第一步长是N毫秒(ms),N大于或等于5ms且小于或等于60ms,所述第一窗口大小高于或等于10ms,所述第二步长是5ms且所述第二窗口大小是10ms。
[0017]在一些实施方案中,所述第一步长是20毫秒(ms),所述第一窗口大小是10ms或20ms或40ms,所述第二步长是10ms且所述第二窗口大小是10ms或20ms。
[0018]在一些实施方案中,所述第一步长是10毫秒(ms),所述第一窗口大小是10ms或20ms,所述第二步长是5ms,且所述第二窗口大小是10ms。
[0019]在一些实施方案中,所述第一步长是20毫秒(ms),所述第一窗口大小是10ms、20ms或40ms,所述第二步长是5ms且所述第二窗口大小是10ms。
[0020]在一些实施方案中,所述窗函数是具有可配置渐隐长度的凯撒

贝索导出(KBD)窗函数。
[0021]在一些实施方案中,所述低通滤波器是截止频率为约130Hz或低于130Hz的四阶巴特沃斯滤波低通滤波器。
[0022]在一些实施方案中,所述方法进一步包括:使用所述一或多个处理器确定所述LFE声道信号的帧的能量级是否低于阈值;根据所述能量级低于阈值级,产生静寂帧指示符以指示所述解码器;将所述静寂帧指示符插入到所述LFE声道位流的元数据中;及在检测到静寂帧时减小LFE声道位速率。
[0023]在一些实施方案中,一种对低频率效应(LFE)声道位流进行解码的方法包括:使用一或多个处理器接收LFE声道位流,所述LFE声道位流包含表示时域LFE声道信号的频谱的熵译码系数;使用所述一或多个处理器使用熵解码器将经量化系数解码;使用所述一或多个处理器将经逆量化系数逆量化,其中所述系数已根据用于在编码器中对所述时域LFE声道信号进行滤波的低通滤波器的频率响应曲线而在与频带对应的次频带群组中被量化;使
用所述一或多个处理器将经逆量化的所述系数转换成时域LFE声道信号;使用所述一或多个处理器调整所述时域LFE声道信号的延迟;及使用低通滤波器对所述经延迟调整的LFE声道信号进行滤波。
[0024]在一些实施方案中,低通滤波器的阶数经配置以确保由于对包含所述LFE声道信号的多声道音频信号中的所述LFE声道进行编码及解码所致的第一总算法延迟小于或等于由于对其它声道进行编码及解码所致的第二总算法延迟。
[0025]在一些实施方案中,所述方法进一步包括:确定所述第二总算法延迟是否超过阈值;及根据所述第二总算法延迟超过所述阈值,将所述低通滤波器配置为N阶低通滤波器,其中N是大于或等于2的整数;及根据所述第二总算法延迟不超过所述阈值,将所述低通滤波器的所述阶数配置为小于N。
[0026]本文中所揭示的其它实施方案涉及系统、设备及计算机可读媒体。在随附图式及下文说明中陈述一或多个所揭示实施方案的细节。依据说明、图式及权利要求书明了其它特征、目标及优点。
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对低频率效应(LFE)声道进行编码的方法,其包括:使用一或多个处理器接收时域LFE声道信号;使用低通滤波器对所述时域LFE声道信号进行滤波;使用所述一或多个处理器将所述经滤波的时域LFE声道信号转换成所述LFE声道信号的包含表示所述LFE声道信号的频谱的一定数目个系数的频域表示;使用所述一或多个处理器将系数布置到与所述LFE声道信号的不同频带对应的一定数目个次频带群组中;使用所述一或多个处理器根据所述低通滤波器的频率响应曲线将每一次频带群组中的系数量化;使用所述一或多个处理器使用针对每一次频带群组调谐的熵译码器对所述次频带群组中的所述经量化系数进行编码;及使用所述一或多个处理器产生包含所述经编码的经量化系数的位流;及使用所述一或多个处理器将所述位流存储于存储装置上或将所述位流流式传输到下游装置。2.根据权利要求1所述的方法,其中将每一次频带群组中的所述系数量化进一步包括:基于可用量化点的最大数目及所述系数的绝对值的和来产生缩放移位因数;及使用所述缩放移位因数将所述系数量化。3.根据权利要求2所述的方法,如果经量化系数超过量化点的所述最大数目,那么将所述缩放移位因数减小且再次将所述系数量化。4.根据前述权利要求1到3中任一权利要求所述的方法,其中对于每一次频带群组来说,所述量化点是不同的。5.根据前述权利要求1到4中任一权利要求所述的方法,其中根据精细量化方案或粗略量化方案将每一次频带群组中的所述系数量化,其中与根据所述粗略量化方案指派给一或多个次频带群组的量化点相比,利用所述精细量化方案将更多量化点分配给所述相应次频带群组。6.根据前述权利要求1到5中任一权利要求所述的方法,其中所述系数的正负号位与所述系数分开译码。7.根据前述权利要求1到6中任一权利要求所述的方法,其中存在四个次频带群组,且第一次频带群组对应于0Hz到100Hz的第一频率范围,第二次频带群组对应于100Hz到200Hz的第二频率范围,第三次频带群组对应于200Hz到300Hz的第三频率范围,且第四次频带群组对应于300Hz到400Hz的第四频率范围。8.根据前述权利要求1到7中任一权利要求所述的方法,其中所述熵译码器是算术熵译码器。9.根据前述权利要求1到8中任一权利要求所述的方法,其中将所述经滤波的时域LFE声道信号转换成所述LFE声道信号的包含表示所述LFE声道信号的频谱的一定数目个系数的频域表示进一步包括:确定所述LFE声道信号的第一步长;基于所述第一步长指定窗函数的第一窗口大小;将所述第一窗口大小应用于所述时域LFE声道信号的一或多个帧;及
将修改型离散余弦变换(MDCT)应用于所述经窗口化的帧以产生所述系数。10.根据权利要求9所述的方法,其进一步包括:确定所述LFE声道信号的第二步长;基于所述第二步长指定所述窗函数的第二窗口大小;及将所述第二窗口大小应用于所述时...

【专利技术属性】
技术研发人员:R
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1