当前位置: 首页 > 专利查询>诺基亚公司专利>正文

信号处理制造技术

技术编号:5496068 阅读:123 留言:0更新日期:2012-04-11 18:40
本发明专利技术披露了一种用于处理音频信号的方法和设备。两个或更多音频信号被输入并分析以形成一组参数。所述两个或更多音频信号中的至少两个被合并以形成组合音频信号。在该方法中,基于组合音频信号的信号电平与输入音频信号中的至少一个的信号电平之差,确定组合音频信号的信号电平和校正因子。校正因子可以用来降低组合音频信号的信号电平与输入音频信号的信号电平之差。本发明专利技术还公开了一种用于合成来自组合音频信号的音频信号的方法。该参数可被用于合成过程中。本发明专利技术还公开了一种计算机程序,包括当该程序在处理器上运行时适合于执行音频信号的处理的程序代码装置。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及多声道音频源的表示以及双耳(binaural)音频编码声道。本专利技术涉及 一种用于形成组合音频信号的方法和设备,以及一种根据从该组合音频信号重建两个或 更多音频信号的方法和设备。
技术介绍
空间音频场景包括音频源和围绕收听者的环境。图1示出了一个示例情形,其 中不同的声源101、102围绕着收听者103或仿真人头部记录设备104a、104b。另外,还 存在由房间效果引起的环境背景噪声,即由于音频源所处的空间的特性而引起的音频源 的混响。图像由于来自音频源的声音的到达方向以及混响的缘故而被觉察到。人能够使 用来自左耳和右耳的信号来捕获三维图像。从而,使用接近耳鼓膜的麦克风来记录音频 图像足以捕获空间音频图像。对使用两声道的空间音频图像的有效传输和表示可能需要针对音频内容的特定 编码算法。空间信息可能需要被有效地传送到接收机和在其中对捕获场景进行渲染的表 示设备。
技术实现思路
本专利技术的示例实施例提供了一种方法,其中,来自多个源的信号被下混频成较 少数量的信号,并且还形成与环境相关的信息。下混频信号能够被上混频以形成多个信 号,上混频形成的多个信号看起来像原始信号的至少一部分并且考虑到了环境。本专利技术的示例实施例的想法是一种考虑到一个或多个环境分量的双耳音频编码 算法。该算法可选地包括执行时间-频率变换和/或双耳音频信号的分析。该算法估计 声道之间的电平和时间差。这种估计可以使用可选的时间-频率系数。该算法还估计针 对下混频信号的声道间电平校正增益以便合并环境信号的贡献。声道间电平和时间差以 及关于一个或多个子带的环境电平校正线索信息能够被发射和/或存储。下混频信号能 够由编码器来进行编码,该编码器可以是语音/音频编码器。在接收端中可以通过如下 步骤来执行两声道信号重建例如,使用电平校正信息来合成环境信号分量、用解码器 来对下混频信号进行解码、对下混频信号进行时间-频率转换和分析、使用一个或多个 子带中接收的声道间电平和时间差来合成多声道信号,以及通过使用环境电平校正线索 (cue)将一个或多个子带中的双耳信号解相关来合成环境分量声道。根据本专利技术的第一方面提供了一种方法,该方法包括-输入两个或更多音频信号;-分析该音频信号以形成一组参数;-组合所述两个或更多音频信号中的至少两个以形成组合音频信号;该方法的特征在于,该分析包括-确定组合音频信号的信号电平;-基于组合音频信号的信号电平与输入音频信号中的至少一个的信号电平之差来 确定校正因子,以降低组合音频信号的信号电平与输入音频信号的信号电平之差。 根据本专利技术的第二方面提供了一种方法,该方法包括-输入组合音频信号和一个或多个参数,该参数与已经从中形成组合音频信号的 音频信号相关;-基于该组合音频信号和所述一个或多个参数,合成两个或更多音频信号;以 及-使用该参数组来修改合成的音频信号以重建该音频信号的环境。该方法的特征在于,所述一个或多个参数包括校正因子,并且该方法包括在所 述合成两个或更多音频信号时使用该校正因子。根据本专利技术的第三方面提供了一种设备,该设备包括-输入端,用于输入两个或更多音频信号;-分析器,用于分析该音频信号以形成一组参数;-组合器,用于组合所述两个或更多音频信号中的至少两个以形成组合音频信 号;该设备的特征在于,该分析器包括_电平确定器,用于确定该组合音频信号的信号电平;_增益确定器,用于基于组合音频信号的信号电平与输入音频信号中的至少一个 的信号电平之差来确定校正因子,以降低组合音频信号的信号电平与输入音频信号的信 号电平之差。根据本专利技术的第四方面提供了一种设备,该设备包括-输入端,用于输入组合音频信号以及一个或多个参数,该参数与已经从中形成 组合音频信号的音频信号相关;-合成器,用于基于该组合音频信号和所述一个或多个参数,合成两个或更多音 频信号。该设备的特征在于,所述一个或多个参数包括校正因子,并且该设备包括通过 在所述合成两个或更多音频信号时使用该校正因子的校正器。根据本专利技术的第五方面提供了一种计算机程序,该计算机程序包括程序代码装 置,当程序在处理器上运行时该程序代码装置适合于执行下列步骤-输入两个或更多音频信号;-分析该音频信号以形成一组参数;-组合所述两个或更多音频信号中的至少两个以形成组合音频信号;该计算机程序的特征在于,该计算机程序包括程序代码装置,该程序代码装置 适合于-确定组合音频信号的信号电平;-基于组合音频信号的信号电平与输入音频信号中的至少一个的信号电平之差来 确定校正因子,以降低组合音频信号的信号电平与输入音频信号的信号电平之差。根据本专利技术的第六方面提供了一种计算机程序,该计算机程序包括程序代码装 置,当程序在处理器上运行时该程序代码装置适合于执行下列步骤-输入组合音频信号以及一个或多个参数,该参数与已经从中形成组合音频信号 的音频信号相关;-基于该组合音频信号和所述一个或多个参数,合成两个或更多音频信号; 该计算机程序的特征在于,所述一个或多个参数包括校正因子,并且该计算机 程序包括程序代码装置,该程序代码装置适合于在所述合成两个或更多音频信号时使用 该校正因子。开发的概念能够例如应用于远程监控和音频/视频会议服务。本专利技术的一些示 例涉及语音和音频编码、媒体自适应、实时多媒体在分组交换网络(例如,IP话音)上的 传输,等等。附图说明本专利技术的一些示例实施例将在下面参考附图被更详细地描述,其中图1描绘了使用两个麦克风的空间音频图像捕获的示例,图2描绘了双耳和多声道音频分析功能的示例,图3描绘了针对不同子带和时刻来确定声道间电平差、声道间时间差和声道对 之间的声道间相干性的示例,图4描绘了双耳合成的示例,图5描绘了多声道音频编码和解码算法的示例,图6描绘了根据本专利技术的编码器的示例实施例的简化框图,图7描绘了根据本专利技术的解码器的示例实施例的简化框图,图8a描绘了根据本专利技术的编码方法的示例实施例的简化流程图,图8b描绘了根据本专利技术的分析阶段的示例实施例的简化流程图,图9描绘了根据本专利技术的解码方法的示例实施例的简化流程图,图10描绘了本专利技术能够在其中应用的装置的示例,以及图11描绘了本专利技术能够在其中应用的系统的示例。具体实施例方式一种用于空间音频编码的方法是双耳线索编码(BCC)参数化,其中,例如通过 使用傅里叶变换或正交镜像滤波器组(QMF)分解,由两个或更多声道组成的输入信号首 先在时间-频率域中被变换。在变换中,声道的音频信号的时间部分被变换到频域中, 其中,信号的频域表示包括多个子带。从而,对于特定的时刻k,音频信号有多个子带表7J\ ο图2给出了空间音频编码的基本思想。音频场景201在变换域203中被分析 202,并且相应的参数化被发射到接收机。场景参数还能够在对多声道声音进行下混频 204时被用于例如移除声道之间的时间差。然后,下混频信号205能够被转发,以例如用 于单声道/立体声的音频编码器。BCC 分析BCC分析由每个变换域时间-频率(时间_子带)隙内估计的声道间电平差 (ILD)和声道间时间差(ITD)参数组成。另外,每个或一部分声道对之间的声道间相干性(IC)可以被确定。这些参数也可以被称为BCC线索或声道间线索。图3公开了针对多 声道音频内容的声道间电平差和声道间时间差估计的示例本文档来自技高网...

【技术保护点】
一种方法,包括:-输入两个或更多音频信号;  -分析所述音频信号以形成一组参数;  -组合所述两个或更多音频信号中的至少两个以形成组合音频信号;  其特征在于所述分析包括  -确定所述组合音频信号的信号电平;  -基于所述组合音频信号的信号电平与所述输入音频信号中的至少一个的信号电平之差来确定校正因子,以降低所述组合音频信号的信号电平与所述输入音频信号的信号电平之差。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:P奥雅拉
申请(专利权)人:诺基亚公司
类型:发明
国别省市:FI[芬兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1