用于音频数据的压缩和解压缩的自适应和固定映射制造技术

技术编号:31502966 阅读:17 留言:0更新日期:2021-12-22 23:27
本文公开了用于压缩音频数据的系统、方法和软件。在一实现中,音频信号的采样值具有动态范围。动态范围到至少一个较低范围和一个较高范围的划分是基于采样值的较低部分到定量值集合中的具有小于采样值的深度的深度的定量值子集的固定映射来被标识的。然后,采样值的较高部分到该定量值集合中的剩余定量值子集的自适应映射还至少基于较高范围的大小来被标识。固定映射用于对采样值的较低部分进行编码,而自适应映射用于基于自适应映射对采样值的较高部分进行编码。值的较高部分进行编码。值的较高部分进行编码。

【技术实现步骤摘要】
【国外来华专利技术】用于音频数据的压缩和解压缩的自适应和固定映射


[0001]本公开的各方面涉及音频信号,尤其涉及压缩和解压缩音频数据。

技术介绍

[0002]许多设备使用一组特定的音调、声音或音乐来向用户传达操作状态。例如,许多游戏系统会发出不同的声音来指示设备正在开机、关机、弹出磁盘或根本没有磁盘。压缩算法被用来使存储相关联的音频数据更高效,但从成本和资源的角度来看,所需的解压缩通常是昂贵的。使用未经压缩的音频数据克服了这些限制,但存储效率低下。
[0003]折衷办法是降低音频信号的保真度。音调首先被以24位格式采样,并且随后被转换为16位格式。大约65,000个不同的值可以由16位(二进制)表示,但要以存储为代价。通过将音调的深度减少到8位,存储成本几乎减半,但信号的大部分保真度被丢失,因为仅128个不同的值可由8位表示。数据可被扩展回16位,但一旦保真度已被丢失,其便无法被恢复。
[0004]然而,音频数据的这种压缩和扩展已经在各种应用中被采用,以使它们的存储或带宽效率更高,即使以保真度为代价。例如,许多电话系统降低了承载语音通信的信号的保真度以便节省带宽。这具有使电话呼叫的声音不那么忠实于面对面交谈的声音的效果。
[0005]音频信号的大部分动态范围集中在其正弦波形的少数样本内。这意味着在音频信号被压缩时发生的保真度损失集中在动态范围的较低(或较柔和)部分上。将数据扩展到更大的深度可能有助于将数据置于适合进一步处理的格式中,但其不会返回到其原始保真度。结果是质量不良的可听信号,该可听信号缺少太多其原始动态范围——尤其是范围内的较低部分。
[0006]概览
[0007]本文公开了增强音频数据的压缩和解压缩的技术,从而在减轻解压缩的性能和成本影响的情况下相比其他方式允许在信号的较低范围内维持更大保真度。
[0008]在一实现中,音频信号的采样值具有动态范围。动态范围到至少一个较低范围和一个较高范围的划分是基于一些采样值到定量值(quanta)集合中的具有小于采样值的深度的深度的定量值子集的固定映射来被标识的。然后,采样值的剩余部分到定量值集合中的剩余定量值子集的自适应映射还至少基于较高范围的大小来被标识。固定映射用于编码采样值的较低范围,而自适应映射用于编码采样值的较高范围。
[0009]在另一实现中,存储器具有存储在其上的包括第一经编码值和第二经编码值的文件。第一经编码值包括在信号的动态范围的较低范围内、通过采样值的较低部分到定量值集合中的定量值子集的固定映射来被编码的采样值的较低部分。定量值集合具有小于采样值的深度的深度。第二经编码值包括在信号的动态范围的较高范围内、通过采样值的较高部分到定量值集合中的剩余定量值子集的自适应映射来被编码的采样值的较高部分。
[0010]该文件还包括用于将定量值集合映射到具有大于定量值集合的深度的深度的对应经解码值集合的密钥。与存储器可操作地耦合的一个或多个处理器读取文件,使用密钥将第一经编码值和第二经编码值映射到经解码值,并输出经解码值。
[0011]提供本概览以便以简化的形式介绍以下在技术公开中进一步描述的概念的选集。可以理解,本概览并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
[0012]附图简述
[0013]参考以下附图可更好地理解本公开的许多方面。附图中的组件不一定按比例绘制,而是重点放在清楚地解说本公开的原理上。而且,贯穿若干视图,附图中相同的附图标记表示对应的部分。尽管结合这些附图描述了若干实施例,但是本公开不局限于本文中所公开的这些实施例。相反,意图是要覆盖所有的替换方案、修改和等价物。
[0014]图1解说了音频数据压缩的一实现中的操作环境和相关场景。
[0015]图2解说了一实现中的编码过程。
[0016]图3解说了在解压缩或扩展的一实现中的操作环境和相关场景。
[0017]图4解说了一实现中的解码处理。
[0018]图5解说了一实现中的音频数据编码的示例。
[0019]图6解说了一实现中的音频数据解码的示例。
[0020]图7解说了一实现中的音频数据编码的示例。
[0021]图8解说了一实现中的音频数据解码的示例。
[0022]图9A和9B解说了固定映射和自适应映射的示例。
[0023]图10解说了适合于实现以下关于附图讨论的各种操作环境、架构、过程、场景和序列的计算设备。
[0024]详细描述
[0025]本文公开了用于使用固定和自适应映射方案来压缩音频数据以使得与先前的解决方案相比在更大程度上节省存储空间并保持保真度的技术。下面讨论的固定映射确保当音频数据从一个深度被向下转换到另一深度时信号动态范围的较低部分中的采样值被保留。自适应映射与可通过从一种音调或声音到另一种音调或声音的固定映射而获得的覆盖范围相适配。由固定和自适应映射产生的经编码值可连同用于解码这些值的密钥一起被写入音频文件。
[0026]该文件(相对于其原始对应物在大小上减小)可被部署在存储受约束的环境的上下文中,诸如为游戏机控制台、家庭和娱乐电器以及甚至一些贺卡驱动可听声音的微控制器。与资源匮乏的解压缩方案相比,将经编码值向上转换为适合播出的较大深度的板上(on

board)过程是对这些值的直截了当的映射。并且如所提及的,解码可以由便宜的微控制器来执行,该微控制器可以在设备上的主处理单元准备就绪之前操作。因而,本文公开的(诸)解决方案尤其适用于产生表示诸如开机、关机等各种状态的相对短暂的音调或音调组的设备。
[0027]现在参考附图,图1解说了一实现中的操作环境100。操作环境100包括计算机110和媒体设备120。计算机110代表能够基于固定和动态映射处理音频数据并产生其中存储有经编码音频数据的文件的任何计算设备。示例包括但不限于膝上型和台式计算机、服务器计算机以及具有适合于压缩音频数据的架构的其他此类计算设备,其中图10中的计算机架构1001是代表性的。
[0028]媒体设备120代表能够基于存储在由计算机110产生的文件中的经编码音频数据
来播出可听声音的任何设备。媒体设备120的示例包括但不限于所有类型的计算机、电话、游戏控制台、数字电器、娱乐设备、以及采用微控制器来驱动音调、声音、音乐等的输出的任何其他设备。事实上,即使是非常简单的设备(诸如具有音频特征的贺卡)也是媒体设备120的示例。
[0029]在操作中,记录装备(未示出)记录音频信号101并对信号进行采样以产生其中存储有采样值的文件105。采样值具有“x”的深度,诸如16位(尽管信号最初可能被以更高的深度采样,例如24位,并且被向下转换为16位)。文件105代表具有根据各种格式(诸如脉冲编码调制(PCM)格式、波形音频文件(WAV)格式和音频交换文件格式(AIFF))中的任一种来存储的原始音频数据的任何文件。采样值可以表示电压、安培、功率或任何其他度量单位。在一些场景中,采样值可表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于压缩具有动态范围的音频数据的采样值的方法,所述方法包括:标识所述音频数据的采样值的较低范围到定量值集合中的具有小于所述采样值的深度的深度的定量值子集的固定映射;标识在所述采样值的较低范围的所述固定映射之后剩余的所述音频数据的采样值的较高范围;标识所述采样值的较高范围到所述定量值集合中的剩余定量值子集的自适应映射;以及基于所述固定映射来编码所述采样值的较低范围;以及基于所述自适应映射来编码所述采样值的较高范围。2.如权利要求1所述的方法,其中,标识在所述固定映射之后剩余的所述采样值的较高范围包括:标识映射到所述定量值子集的所述采样值的较低范围中的最大值;以及在所标识的最大值处将所述动态范围划分成所述较低范围和所述较高范围。3.如权利要求2所述的方法,其中,所述较高范围的大小包括基于所述采样值中的最大值减去所述采样值的较低范围中的最大值而确定的所述较高范围的大小。4.如权利要求3所述的方法,其中,所述定量值子集包括固定数目的定量值,并且其中所述固定映射包括所述固定数目的定量值到相同数目的采样值的一对一映射。5.如权利要求4所述的方法,其中,所述剩余定量值子集包括剩余数目的定量值,并且其中所述自适应映射包括剩余采样值到所述剩余数目的定量值的多对一映射。6.如权利要求5所述的方法,其中,基于所述固定映射来编码所述较低范围包括,对于所述采样值的较低范围中的每个值,将该值转换为所述定量值子集中的对应定量值,并将该对应定量值写入文件。7.如权利要求6所述的方法,其中,基于所述自适应映射来编码所述较高范围包括,对于所述采样值的较高范围中的每个值,将该值转换为所述定量值子集中的最接近定量值,并将该最接近定量值写入所述文件。8.如权利要求7所述的方法,其中,所述文件包括用于将所述定量值集合映射到具有大于所述定量值集合的深度的深度的对应经解码值集合的密钥。9.如权利要求8所述的方法,其中,所述定量值集合的深度包括8位,所述对应经解码值集合的深度包括16位,并...

【专利技术属性】
技术研发人员:G
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1