基于高频带信号特征的时间增益调整制造技术

技术编号:15343491 阅读:52 留言:0更新日期:2017-05-17 00:28
本发明专利技术提供用于调整时间增益参数且用于调整线性预测系数的技术。所述时间增益参数的值可基于音频信号的经合成高频带部分与所述音频信号的高频带部分的比较。如果所述高频带部分的较高频率范围的信号特征满足第一阈值,则可调整所述时间增益参数。线性预测LP增益可基于LP增益操作来确定,所述LP增益操作使用LP阶数的第一值。所述LP增益可与LP合成滤波器的能量等级相关联。如果所述LP增益满足第二阈值,则可减小所述LP阶数。

【技术实现步骤摘要】
【国外来华专利技术】基于高频带信号特征的时间增益调整优先权主张本申请案主张来自标题都为“基于高频带信号特征的时间增益调整(TEMPORALGAINADJUSTMENTBASEDONHIGH-BANDSIGNALCHARACTERISTIC)”的2014年6月26日申请的第62/017,790号美国临时专利申请案及2015年6月4日申请的第14/731,198号美国专利申请案的优先权,所述案的内容以全文引用的方式并入本文中。
本专利技术大体上涉及信号处理。
技术介绍
技术的进步已产生体积较小且功能更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(PDA)及传呼装置等,其体积小、重量轻且易于由用户携带。更具体言之,便携式无线电话(例如蜂窝式电话及因特网协议(IP)电话)可经由无线网络传达语音及数据包。另外,许多所述无线电话包含并入于其中的其它类型的装置。举例来说,无线电话也可包含数字静态相机、数字视频摄像机、数字记录器及音频文件播放器。由数字技术发射语音为普遍的,尤其在长距离及数字无线电电话应用中。确定可经由信道发送的最少信息量同时维持经重建话音的所感知质量可为关注事项。如果通过采样及数字化来发射话音,则数量级为六十四千位/每秒(kbps)的数据速率可用于达成模拟电话的话音质量。经由在接收器处使用话音分析,继之以译码、发射及重新合成,可达成数据速率的显著减小。用于压缩话音的装置可用于许多电信领域中。例示性领域为无线通信。无线通信的领域具有许多应用,包含(例如)无线电话、传呼、无线区域环路、例如蜂窝式及个人通信服务(PCS)电话系统的无线电话、移动因特网协议(IP)电话及卫星通信系统。特定应用为用于移动订户的无线电话。已开发出用于无线通信系统的各种空中接口,包括(例如)频分多址接入(FDMA)、时分多址接入(TDMA)、码分多址接入(CDMA)及时分同步CDMA(TD-SCDMA)。结合所述空中接口,已建立了各种国内及国际标准,包含(例如)高级移动电话服务(AMPS)、全球移动通信系统(GSM)及暂行标准95(IS-95)。例示性无线电话通信系统为码分多址接入(CDMA)系统。IS-95标准及其衍生标准(IS-95A、ANSIJ-STD-008及IS-95B)(本文中统称为IS-95)由电信工业协会(TIA)及其它公认标准机构颁布以指定CDMA空中接口针对蜂窝式或PCS电话通信系统的使用。IS-95标准随后演进成例如cdma2000及WCDMA的“3G”系统,所述“3G”系统提供更大容量及高速度包数据服务。cdma2000的两个变体由TIA发布的文件IS-2000(cdma20001xRTT)及IS-856(cdma20001xEV-DO)呈现。cdma20001xRTT通信系统给予153kbps的峰值数据速率,而cdma20001xEV-DO通信系统定义范围介于38.4kbps到2.4Mbps的数据速率集合。WCDMA标准体现于第三代合作伙伴计划“3GPP”第3GTS25.211号、第3GTS25.212号、第3GTS25.213号及第3GTS25.214号文档中。高级国际移动电信(高级IMT)规范阐述“4G”标准。对于高移动性通信(例如,来自火车及汽车),高级IMT规范设定100百万位/秒(Mbit/s)的峰值数据速率用于4G服务,且对于低移动性通信(例如,来自行人及固定用户)设定1十亿位/秒(Gbit/s)的峰值数据速率。使用通过提取关于人类话音产生模型的参数来压缩话音的技术的装置被称为话音译码器。话音译码器可包括编码器及解码器。编码器将传入话音信号划分成时间块或分析帧。可将每一时间分段(或“帧”)的持续时间选择为足够短,以使得可预期信号的频谱包络为保持相对固定。举例来说,一个帧长度为20毫秒,此对应于8千赫(kHz)采样速率下的160个样本,尽管可使用被视为适合于特定应用的任何帧长度或采样速率。编码器分析传入话音帧以提取某些相关参数,且接着将所述参数量化成二进制表示,即,量化成位集合或二进制数据包。经由通信信道(即,有线及/或无线网络连接)将数据包发射到接收器及解码器。解码器处理数据包、去量化经处理数据包以产生参数并使用经去量化参数重新合成话音帧。话音译码器的功能为通过移除话音中固有的自然冗余而将经数字化话音信号压缩成低位速率信号。可通过用参数集合表示输入话音帧及使用量化以通过位集合表示参数来达成数字压缩。如果输入话音帧具有位数目Ni,且由话音译码器所产生的数据包具有位数目No,则由话音译码器所达成的压缩因数为Cr=Ni/No。挑战为在达成目标压缩因数时保持经解码话音的高语音质量。话音译码器的性能取决于:(1)话音模型或上文所描述的分析及合成过程的组合执行得有多好;及(2)在每帧No个位的目标位速率下参数量化过程执行得有多好。因此,话音模型的目标为在针对每一帧具有小参数集合的情况下撷取话音信号的本质或目标语音质量。话音译码器通常利用参数集合(包含向量)来描述话音信号。良好参数集合向感知上准确的话音信号的重建理想地提供低系统带宽。音调、信号功率、频谱包络(或共振峰)、振幅及相谱为话音译码参数的实例。话音译码器可经实施为时域译码器,其试图通过使用高时间分辨率处理以每次编码小的话音区段(通常为5毫秒(ms)的子帧)来撷取时域话音波形。对于每一子帧,借助于搜索算法发现来自码簿空间的高精确度代表。替代地,话音译码器可经实施为频域译码器,其试图用参数集合(分析)来撷取输入话音帧的短期话音频谱,且使用对应合成过程以从频谱参数来重新产生话音波形。参数量化器通过根据已知量化技术用码向量的所存储表示来表示参数而保留参数。一个时域话音译码器为码激励线性预测(CELP)译码器。在CELP译码器中,通过找到短期共振峰滤波器的系数的线性预测(LP)分析来移除话音信号中的短期相关或冗余。将短期预测滤波器应用于传入话音帧产生LP残余信号,LP残余信号是用长期预测滤波器参数及后续随机码簿予以进一步建模及量化。因此,CELP译码将编码时域话音波形的任务划分成编码LP短期滤波器系数及编码LP残余的单独任务。可以固定速率(即,针对每一帧使用相同数目(No)个位)或以可变速率(其中针对不同类型的帧内容使用不同位速率)执行时域译码。可变速率译码器试图使用将译码解码器参数编码到充分获得目标质量的等级所需要的位量。例如CELP译码器的时域译码器通常可依赖于每帧高数目(N0)个位以保留时域话音波形的准确度。倘若每帧的位数目No相对大(例如,8kbps或高于8kbps),则这些译码器可递送极好的语音质量。在低位速率(例如,4kbps及低于4kbps)下,归因于受限数目个可用位,时域译码器可不能保持高质量及稳健性能。在低位速率下,受限码簿空间削减在较高速率商业应用中所部署的时域译码器的波形匹配能力。因此,尽管随时间推移进行改良,但以低位速率操作的许多CELP译码系统仍遭受特征化为噪声的感知明显失真。低位速率下对CELP译码器的替代例为根据类似于CELP译码器的原理操作的“噪声激励线性预测”(NELP)译码器。NELP译码器使用经滤波伪随机噪声信号来建模话音而非码簿。由于NELP将较简单模型用于经译本文档来自技高网...
基于高频带信号特征的时间增益调整

【技术保护点】
一种方法,其包括:在编码器处确定音频信号的高频带部分的较高频率范围的信号特征是否满足阈值;产生对应于所述高频带部分的高频带激励信号;基于所述高频带激励信号产生经合成高频带部分;基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值;及响应于所述信号特征满足所述阈值,调整所述时间增益参数的所述值,其中调整所述时间增益参数的所述值控制所述时间增益参数的可变性。

【技术特征摘要】
【国外来华专利技术】2014.06.26 US 62/017,790;2015.06.04 US 14/731,1981.一种方法,其包括:在编码器处确定音频信号的高频带部分的较高频率范围的信号特征是否满足阈值;产生对应于所述高频带部分的高频带激励信号;基于所述高频带激励信号产生经合成高频带部分;基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值;及响应于所述信号特征满足所述阈值,调整所述时间增益参数的所述值,其中调整所述时间增益参数的所述值控制所述时间增益参数的可变性。2.根据权利要求1所述的方法,其中调整所述时间增益参数的所述值限制所述时间增益参数的所述可变性。3.根据权利要求1所述的方法,其进一步包括:确定对应于分析滤波器组的输出的能量值的总和;及对所述总和执行求平均运算以确定所述信号特征。4.根据权利要求3所述的方法,其进一步包括:通过对所述音频信号执行频谱翻转操作而产生所述音频信号的经频谱翻转版本以在基带下处理所述音频信号的所述高频带部分;及基于所述音频信号的所述经频谱翻转版本计算能量值的所述总和,能量值的所述总和对应于所述音频信号的所述高频带部分的所述较高频率范围。5.根据权利要求4所述的方法,其中所述音频信号的所述高频带部分的所述较高频率范围对应于所述音频信号的所述经频谱翻转版本的较低频率范围。6.根据权利要求3所述的方法,其中所述能量值处于对数域中。7.根据权利要求3所述的方法,其中所述分析滤波器组包括正交镜像滤波器QMF分析滤波器组。8.根据权利要求3所述的方法,其中所述分析滤波器组包括复合低延迟滤波器组。9.根据权利要求1所述的方法,其中所述高频带激励信号基于所述音频信号的低频带部分的谐波扩展来产生。10.根据权利要求9所述的方法,其进一步包括对所述音频信号的所述低频带部分的所述谐波扩展执行频谱翻转操作以产生经频谱翻转信号。11.根据权利要求10所述的方法,其进一步包括:对所述经频谱翻转信号执行带通滤波操作以产生经带通滤波信号;及对所述经带通滤波信号执行降混操作以在基带下产生经降混信号。12.根据权利要求10所述的方法,其进一步包括对所述经频谱翻转信号执行低通滤波操作以产生经低通滤波信号。13.根据权利要求1所述的方法,其中所述信号特征对应于所述高频带部分的所述较高频率范围的信号能量。14.根据权利要求1所述的方法,其中所述高频带部分的所述较高频率范围包含介于12千赫兹kHz与16kHz之间的频率范围。15.根据权利要求1所述的方法,其中所述信号特征基于所接收信号的经频谱翻转版本来确定。16.根据权利要求15所述的方法,其中所述信号特征对应于经平均高频带信号底限。17.根据权利要求1所述的方法,其中所述信号特征满足所述阈值指示所述音频信号在所述高频带部分中具有有限内容。18.根据权利要求1所述的方法,其中所述时间增益参数包括增益形状参数。19.根据权利要求18所述的方法,其进一步包括针对所述音频信号的多个子帧中的每一者确定所述增益形状参数的值。20.根据权利要求18所述的方法,其中调整所述增益形状参数的所述值包括基于归一化常数与所述增益形状参数的第一值的特定百分数的总和来计算所述增益形状参数的第二值。21.根据权利要求20所述的方法,其中所述特定百分数为10%。22.一种设备,其包括:预处理模块,其经配置以对音频信号的至少一部分进行滤波以产生多个输出;第一滤波器,其经配置以确定所述音频信号的高频带部分的较高频率范围的信号特征;高频带激励产生器,其经配置以产生对应于所述高频带部分的高频带激励信号;第二滤波器,其经配置以基于所述高频带激励信号产生经合成高频带部分;及时间包络估计...

【专利技术属性】
技术研发人员:芬卡特拉曼·S·阿提文卡特什·克里希南维韦克·拉金德朗文卡塔·萨伯拉曼亚姆·强卓·赛克哈尔·奇比亚姆苏巴辛格哈·夏敏达·苏巴辛格哈
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1