当前位置: 首页 > 专利查询>诺基亚公司专利>正文

稀疏音频制造技术

技术编号:7955898 阅读:188 留言:0更新日期:2012-11-09 01:00
一种方法,包括:采样在第一速率接收到的音频以产生第一音频信号;变换该第一音频信号到稀疏域以产生稀疏音频信号;再采样该稀疏音频信号以产生再采样稀疏音频信号;以及提供该再采样稀疏音频信号,其中移除精确音频再现所需的带宽但保留空间音频编码所需的带宽;和/或一种方法,包括:接收第一通道的第一稀疏音频信号;接收第二通道的第二稀疏音频信号;以及处理第一稀疏音频信号和第二稀疏音频信号以产生一个或多个通道间空间音频参数。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例涉及稀疏音频。特别是本专利技术的实施例涉及用于空间音频编码以及尤其是空间音频参数的产生使用稀疏音频。
技术介绍
最近开发的诸如双耳线索编码(binaural cue coding, BCC)的参数音频编码方法,使得多通道且环绕的(空间的)音频编码以及表示成为可能。用于空间音频的编码的参 数方法的一般目标是将原始音频表示为包含减少的音频通道数量的缩混(downmix)信号(例如表示为单音通道或表示为双通道(立体声)的总和信号)连同描述在原始信号的通道之间关系的关联的空间音频参数一起以使得具有与原始信号的空间图像相类似的空间图像的信号重建成为可能。这种类型的编码方案允许具有高音频质量的多通道信号非常有效的压缩。空间音频参数例如可包括描述通道间电平(level)差、通道间时间差以及在一个或多个通道对之间的和/或在一个或多个频带中的通道间相干(coherence)的参数。另外,进一步的或可选的例如到达方向的空间音频参数可另外用于或替换讨论过的通道间参数。通常,空间音频编码及对单音或立体声的相应缩混需要可靠的电平及时间差估计或等效值。输入通道的时间差的估计是在低频处的主要空间音频参数。常规的通道间分析机制可能需要高运算负载,尤其是当采用高音频采样速率(48kHz或甚至更高)时。由于大量的信号数据,基于互相关(crosscorrelation)的通道间时间差估计机制在运算上是代价非常高的。此外,如果利用分布式传感器网络捕获音频并且在网络的中心服务器执行空间音频编码,那么在传感器和服务器之间的每个数据通道可能需要显著的传输带宽。通过仅仅减少音频采样率而不丢失在后续处理阶段中所需的信息来减少带宽是不可能的。
技术实现思路
为了生成使得高质量的重建和再现成为可能的缩混信号,需要高音频采样率(尼奎斯特(Nyquist)定理)。由于这会显著影响音频再现的质量,因此不能降低音频采样率。专利技术者已经意识到尽管为了生成缩混信号需要高音频采样率,当无需重建输入音频的实际波形以执行空间音频编码时无需执行空间音频编码。由在多通道空间音频编码中的每个通道捕获的音频内容,就本性而言非常相关,如同输入通道被期望彼此相关一样,因为它们只是从不同角度基本上观察相同的音频源和相同的音频图像。在不丢失在空间音频图像中的很多精确度或细节下,可限制由每个传感器传输到服务器的数据量。通过使用已采样音频的稀疏表示和仅处理在稀疏域中的引入(incoming)数据样本的子集,可降低在传感器和服务器之间的数据通道中的信息速率。因此,音频信号需要在适于稀疏表不的域中传输。根据本专利技术的各种(但并非所有)实施例,提供ー种方法,包括采样在第一速率(rate)接收到的音频以产生第一音频信号;变换该第一音频信号到稀疏域以产生稀疏音频信号;再采样该稀疏音频信号以产生再采样稀疏音频信号;并且提供该再采样稀疏音频信号,其中移除精确音频再现所需的带宽但保留空间音频编码所需的带宽。根据本专利技术的各种(但并非所有)实施例,提供一种设备,包括用于采样在第一速率接收到的音频以产生第一音频信号的装置;用于变换该第一音频信号到稀疏域以产生稀疏音频信号的装置;用于再采样该稀疏音频信号以产生再采样稀疏音频信号的装置;以及用于提供该再采样稀疏音频信号的装置,其中到稀疏域的变换移除精确音频再现所需的带宽但保留空间音频编码所需的带宽。根据本专利技术的各种(但并非所有)实施例,提供一种设备,包括至少ー个处理器;和至少ー个包含计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与 该至少一个处理器一起使得该设备执行变换第一音频信号到稀疏域以产生稀疏音频信号;采样该稀疏音频信号以产生已采样的稀疏音频信号;其中到稀疏域的变换移除精确音频再现所需的带宽但保留空间音频编码所需的带宽。根据本专利技术的各种(但并非所有)实施例,提供ー种方法,包括接收第一通道的第一稀疏音频信号;接收第二通道的第二稀疏音频信号;并且处理第一稀疏音频信号和第二稀疏音频信号以产生一个或多个通道间空间音频參数。根据本专利技术的各种(但并非所有)实施例,提供一种设备,包括用于接收第一通道的第一稀疏音频信号的装置;用于接收第二通道的第二稀疏音频信号的装置;以及用于处理第一稀疏音频信号和第二稀疏音频信号以产生一个或多个通道间空间音频參数的装置。根据本专利技术的各种(但并非所有)实施例,提供一种设备,包括至少ー个处理器;和至少ー个包含计算机程序代码的存储器,该至少一个存储器和计算机程序代码配置为与该至少一个处理器一起使得该设备执行处理接收到的第一稀疏音频信号和接收到的第二稀疏音频信号以产生一个或多个通道间空间音频參数。根据本专利技术的各种(但并非所有)实施例,提供ー种方法,包括采样在第一速率接收到的音频以产生第一音频信号;变换该第一音频信号到稀疏域以产生稀疏音频信号;再采样该稀疏音频信号以产生再采样稀疏音频信号;并且提供该再采样稀疏音频信号,其中移除精确音频再现所需的带宽但保留该接收到的音频分析所需的带宽。这降低了空间编码多通道空间音频信号的复杂性。在某些实施例中,減少为空间音频编码提供数据所需的在传感器与服务器之间的数据通道的带宽。根据本专利技术的各种(但并非所有)实施例,提供ー种方法,包括采样在第一速率接收到的音频以产生第一音频信号;变换该第一音频信号到稀疏域以产生稀疏音频信号;再采样该稀疏音频信号以产生再采样稀疏音频信号;并且提供该再采样稀疏音频信号,其中移除精确音频再现所需的带宽但保留接收到的音频分析所需的带宽。该分析例如可确定接收到的音频的基频(fundamental frequency)和/或确定通道间參数。附图说明为了本专利技术实施例的各种示例的更好的理解,现在将仅以示例的方式参考附图,其中图I示意性地例示传感器设备;图2示意性地例示包括多个传感器设备和一个服务器设备的系统;图3示意性地例示服务器设备的一个示例;图4示意性地例示服务器设备的另一个示例; 图5示意性地例示适合于在传感器设备和/或服务器设备中使用的控制器的示例。具体实施例方式最近开发的诸如双耳线索编码(BCC)的参数音频编码方法,使得多通道且环绕的(空间的)音频编码以及表示成为可能。用于空间音频的编码的参数方法的一般目标是将原始音频表示为包含减少的音频通道数量的缩混信号(例如表示为单声通道的或表示为双通道(立体声)的总和信号),与描述在原始信号通道之间的关系相关联的空间音频参数一起以使具有与原始信号的图像相类似的空间图像的信号重建成为可能。这种类型的编码方案允许具有高音频质量的非常有效的多通道信号压缩。空间音频参数例如可包括描述通道间电平差、通道间时间差以及在一个或多个通道对之间和/或一个或多个频带之间的通道间相干的参数。这些空间音频参数中的一些可选择地表示为例如到达方向。图I示意性地例示传感器设备10。传感器设备10在功能上阐述为一系列块,每个块表示不同的功能。在采样块4处,将接收到的音频(压力波)3以第一速率采样以产生第一音频信号5。例如是麦克风的换能器将音频3变换成电子信号。该电子信号接下来以第一速率(例如以48kHz)采样以产生第一音频信号5。这个块可以是常规的。接下来在变换块6处,将第一音频信号5变换到稀疏域以产生稀疏音频信号7。然后在再采样块8处,将稀疏音频信号7本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:P·奥加拉
申请(专利权)人:诺基亚公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1