当前位置: 首页 > 专利查询>微软公司专利>正文

用于熵编码信号量化变换系数的系统和方法技术方案

技术编号:3423587 阅读:163 留言:0更新日期:2012-04-11 18:40
一种处理音频信号和包括可升级音频编码器(300)和解码器的系统和方法。编码器(300)包括一个多分辨率变换处理器(310),例如调制重叠变换(MLT)变换处理器、加权处理器(312)、均匀量化器(314)、屏蔽阈值频谱处理器(316)、熵编码器(318)和通信设备(320),例如用于复用(组合)从上述组件接收的信号以在单一介质上传输的多路复用器(MUX)。编码器(300)通过分辨率转换、频谱加权和数字编码来编码音频信号。而且,执行数字编码信号的参数建模以增强编码。解码器包括用于解码已编码音频信号的与编码器(300)相反的组件。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于压缩数字信号的系统和方法,具体地说,涉及一种能够升级数字音频信号的编码和解码的系统和方法。现在,数字音频表示在许多应用中是很平常的。例如,音乐光盘(CD)、互联网音频剪辑、卫星电视、数字化视频光盘(DVD)和依靠数字音频技术的电话机(有线的或蜂窝的)。通过使用模数(A/D)转换器将模拟音频信号变换成数字信号实现音频信号的数字表示。然后,数字表示可以被编码、压缩、存储、传输和使用等。如果需要,然后可以使用数模(D/A)转换器将数字信号转换回模拟信号。A/D和D/A转换器定期抽样模拟信号,通常以下述标准频率之一8kHz,用于电话机、互联网、视频会议;11.025kHz,用于互联网、只读光盘驱动器;16kHz,用于视频会议、远距离音频广播、互联网、未来电话机;22.05kHz,用于只读光盘驱动器、互联网;32kHz,用于只读光盘驱动器、视频会议、ISDN音频;44.1kHz,用于音频光盘;和48kHz,用于播音室音频再生。典型地,如果在转换之后编码或压缩音频信号,由A/D生成的原始比特通常以每音频抽样16比特被格式化。对于音频光盘,例如,原始比特速率是44.1kHz×16比特/抽样=705.6kbps(千比特/秒)。对于电话机,原始比特速率是8kHz×8比特/抽样=64kbps。对于音频光盘,在存储容量大约是700兆字节(5600兆比特)的地方,可以存储原始比特,并且不需要压缩。然而,小型光盘仅能存储大约140兆字节,所以需要大约4∶1的压缩以将30分钟到1小时的音频装入2.5英寸小型光盘。对于互联网电话和大多数其它应用,原始比特速率对于大多数的当前信道容量太高。因而,使用能够进行有效压缩的高效编码/解码器(通常称作编码器/解码器或编解码器)。例如,对于互联网电话机,原始比特速率是64kHz,但所需的信道速率在5至10kbps之间变化。因此,编解码器需要以5至15之间的因子压缩比特速率,带有最小的可觉察的音频信号质量损失。随着当前处理芯片的发展,编解码器可以以专用硬件,通常用可编程数字信号处理器(DSP)芯片实现,或者以通用计算机的软件来实现。因此,希望使编解码器可以实现,例如1)低计算复杂性(编码复杂性对于所存储的音频通常不是问题);2)优良的再生保真度(不同的应用将具有不同的质量要求);3)对信号变化的强壮性(音频信号可以是清楚的话音、嘈杂的话音、多个谈话者、音乐等等,编解码器可以处理的这种信号的范围越广越好);4)低延迟(在诸如电话机和视频会议的实时应用中);5)可升级性(适应不同信号抽样速率和不同信道容量的容易程度-尤其希望编码之后的可升级性,即转换成不同抽样速率或信道速率而不需要重新编码);和6)压缩域中的信号修改(如果编解码器允许在压缩域中处理,或者至少不需要完全解码和重新编码,诸如多个信道混合、干扰压缩和其它的操作可以更快)。当前,商业系统使用多种不同的数字音频技术。一些例子包括ITU-T标准G.711,G.726,G.722,G.728,G.723.1和G.729;其它电话标准GSM、半速率GSM、蜂窝CDMA(IS-733);高保真音频杜比AC-2和AC-3、MPEG LⅡ和LⅢ、索尼小型光盘;互联网音频ACELP-Net、DolbyNet、PictureTel Siren、RealAudio;和军事应用LPC-10和USFS-1016声码器。然而,当前的这些编解码器具有多种限制。即,当前编解码器的计算复杂性不够低。例如,当编解码器被集成在一个操作系统中时,希望使编解码器以低CPU使用与其它应用同时运行。另一问题是中等延迟。希望使编解码器允许整个音频获取/重放系统以低于100毫秒的延迟操作,例如,能够实时通信。另一问题是对信号变换的强壮性级别。希望使编解码器不仅能够处理清楚话音,而且能够处理被混响、办公室噪声、电子噪声和背景音乐等影响的话音,并且还能够处理音乐、拨号音和其它声音。而且,大多数现有编解码器的缺点是它们有限的可升级性和支持信号抽样频率和信道数据速率的狭窄范围。例如,多种当前应用通常需要支持多个不同的编解码器。这是因为多种编解码器被设计仅能处理某一范围的抽样速率。一种相关的期望是使编解码器可以允许修改抽样或数据速率而不需要重新编码。另一问题是多方电话会议,服务器必须混合来自各参与者的的音频信号。多个编解码器要求在混合之前解码所有数据流。需要的是编解码器支持在编码或压缩域中混合而不需要在混合之前解码所有数据流。还有一个问题出现在与信号增强功能的集成中。例如,由当前编解码器使用的音频路径在编解码器处理之前可以包括信号增强模块。举一个例子,在免提电话会议中,来自扬声器的信号被麦克风捕获,被本地人员的话音干扰。因此,通常使用回波消除算法来消除扬声器对麦克风的反馈。其它增强操作部分可以包括自动增益控制、降噪器。那些增强操作部分导致将被增加给编码/解码延迟的处理延迟。因而,所需要的是能够将增强处理和编解码器较简单集成的编解码器,以便可以执行所有这些信号增强而不产生除编解码器延迟之外的任何延迟。与编解码器相关的另一个问题是缺少对比特和分组损失的强壮性。在大多数实际实时应用中,通信信道不能免于错误。无线信道可能具有明显的误比特率,并且分组交换信道(例如互联网)可能具有明显的分组损失。因而,所需要的是编解码器允许具有小信号降级的压缩比特流损失,例如最高5%。不管上述系统和方法的优点如何,它们不能实现本专利技术的优点。为了克服上述现有技术中的限制,并克服其它的限制,阅读和理解本专利技术之后这将变得很明显,在使用新编码器/解码器(编解码器)能够可升级地编码和解码音频信号的一种系统和方法中实施本专利技术。本专利技术的编解码器系统包括一个编码器和一个解码器。编码器包括多分辨率变换处理器,例如调制重叠变换(MLT)变换处理器、加权处理器、均匀量化器、屏蔽阈值频谱处理器、熵编码器和一个通信设备,例如复用器(MUX),用于复用(组合)从上述部件接收的信号以在单一介质上传输。解码器包括与编码器相反的部件,例如反多分辨率变换处理器、反加权处理器、反均匀量化器、反屏蔽阈值频谱处理器、反熵编码器和解复用器。使用这些部件,本专利技术能够执行分辨率转换、频谱加权、数字编码和参数建模。本专利技术的一些特征和优点包括低计算复杂性。当本专利技术的编解码器集成在一个操作系统中时,它可以以低CPU使用率与其它应用同时运行。这个编解码器允许整个音频捕获/回放系统以低于例如100毫秒的延迟操作从而能够进行实时通信。这个编解码器具有对信号变化的高级别强壮性,并且它不仅能够处理清楚话音,能够处理受混响、办公室噪声、电噪声、背景音乐等的影响下降的话音,而且能够处理音乐、拨号音和其它声音。另外,该编解码器能够升级,并支持大范围的信号抽样频率和信道数据速率。一个相关特征是这个编解码器允许修改抽样或数据速率而不需要重新编码。例如,这个编解码器可以将32kbps数据流转换成16kbps数据流而不需要完全解码和重新编码。这使服务器能够仅存储高保真度的音频剪辑,在需要时将它们迅速转换成较低的保真度。而且,对于多方电话会议,这个编解码器支持在不需要在混合之前解码所有数据流的情况下在编码或压缩域中的混合。这显著地影响服务器可以处理的音频流数量。本文档来自技高网...

【技术保护点】
在具有一个输入信号的一个系统,该输入信号包括带有量化变换系数的抽样块,一种用于熵编码量化变换系数的方法,该方法包括: 为该抽样块计算最大绝对值(1510); 近似量化系数的峰值(1512); 用在可变-固定编码字典中定义的表示游程长度的新码元替代该抽样块的量化零值游程(1514);和 用可变-固定长度编码器编码新码元以生成用信息比特定义的信道码元(1516)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:亨里克S马瓦
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利