高频带激励信号生成制造技术

技术编号:14241830 阅读:134 留言:0更新日期:2016-12-21 18:27
本发明专利技术提供一种特定方法,其包含在装置处确定输入信号的浊音分类。所述输入信号对应于音频信号。所述方法也包含基于所述浊音分类控制所述输入信号的表示的包络的量。所述方法进一步包含基于所述包络的所述受控量调制白噪声信号。所述方法也包含基于所述经调制的白噪声信号生成高频带激励信号。

【技术实现步骤摘要】
【国外来华专利技术】优先权声明本申请案请求2014年4月30日申请的标题为“HIGH BAND EXCITATION SIGNAL GENERATION”的美国申请案第14/265,693号的优先权,所述美国申请案的内容以全文引用的方式合并。
本专利技术通常涉及高频带激励信号生成
技术介绍
技术的进步已带来更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(PDA)及传呼装置,其体积小,重量轻,且易于用户携带。更具体地,便携式无线电话(例如,蜂窝式电话及因特网协议(IP)电话)可经由无线网络传达语音及数据报。另外,许多这些无线电话包含合并到其中的其它类型的装置。举例来说,无线电话也可包含数字静物照相机、数字摄影机、数字记录器及音频文件播放器。由数字技术发射语音是普遍的,尤其在长距离及数字无线电电话应用中。如果通过采样及数字化发射话音,则大约为六十四千位/秒(kbps)的数据速率可用于达成模拟电话的话音质量。压缩技术可用于减小经由信道发送的信息量,同时维持重新构建的话音的感知质量。经由在接收器处使用话音分析,接着译码、发射及重新合成,可达成数据速率的显著减小。用于压缩话音的装置可用于许多电信领域中。举例来说,无线通信具有许多应用,包含(例如)无绳电话、传呼、无线本地回路、无线电话(例如,蜂窝式及个人通信服务(PCS)电话系统)、移动因特网协议(IP)电话及卫星通信系统。特定应用为用于移动用户的无线电话。已开发用于无线通信系统的各种空中接口,包含(例如)频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)及时分同步CDMA(TD-SCDMA)。结合所述空中接口,已建立各种国内及国际标准,包含(例如)先进移动电话服务(AMPS)、全球移动通信系统(GSM)及临时标准95(IS-95)。示范性无线电话通信系统为码分多址(CDMA)系统。IS-95标准及其衍生标准(IS-95A、ANSI J-STD-008及IS-95B)(本文中统称作IS-95)由电信工业协会(TIA)及其它公认标准机构颁布以指定CDMA空中接口针对蜂窝式或PCS电话通信系统的使用。IS-95标准随后演进成例如cdma2000及WCDMA的“3G”系统,所述“3G”系统提供更大容量及高速度分组数据服务。cdma2000的两个变化由TIA发布的文件IS-2000(cdma2000 1xRTT)及IS-856(cdma2000 1xEV-DO)呈现。cdma2000 1xRTT通信系统提供153kbps的波峰数据速率,而cdma2000 1xEV-DO通信系统定义范围介于38.4kbps至2.4Mbps的数据速率集合。WCDMA标准体现于第三代合作伙伴计划“3GPP”第3G TS25.211号、第3G TS 25.212号、第3G TS 25.213号及第3G TS 25.214号中。先进国际移动电信(先进IMT)规范陈述“4G”标准。对于高移动性通信(例如,来自火车及汽车),先进IMT规范设定100兆位/秒(Mbit/s)的波峰数据速率用于4G服务,且对于低移动性通信(例如,来自行人及静止用户),先进IMT规范设定千兆位/秒(Gbit/s)的波峰数据速率。使用通过提取关于人类话音生成模型的参数来压缩话音的技术的装置被称为话音译码器。话音译码器可包括编码器及解码器。编码器将传入话音信号划分成时间块或分析帧。可将每一时间分段(或“帧”)的持续时间选择为足够短的,使得可预期信号的频谱包络保持相对静止。举例来说,帧长度可为二十毫秒,其对应于八千赫兹(kHz)采样率下的160个样本,但可使用认为适于特定应用的任何帧长度或采样率。编码器分析传入话音帧以提取某些相关参数,且随后将参数量化成二进制表示(例如,位集合或二进制数据包)。将数据包经由通信信道(即,有线和/或无线网络连接)发射至接收器及解码器。解码器处理数据包、去量化经处理数据包以产生参数且使用经去量化的参数重新合成话音帧。话音译码器的功能为通过去除话音中固有的自然冗余而将经数字化话音信号压缩成低位率信号。可通过用参数集合表示输入话音频框及使用量化以通过位集合表示参数来达成数字压缩。如果输入话音帧具有位计数Ni,且由话音译码器所产生的数据包具有位计数No,则由话音译码器所达成的压缩因数为Cr=Ni/No。挑战为在达成目标压缩因数时保留经解码话音的高语音质量。话音译码器的性能取决于:(1)话音模型或上文所描述的分析及合成过程的组合执行得多好,及(2)在No位每帧的目标位率下参数量化过程执行得多好。因此,话音模型的目标为对于每一帧使用较小集合的参数捕获话音信号的本质或目标语音质量。话音译码器通常利用参数集合(包含向量)来描述话音信号。良好参数集合为感知上准确的话音信号的重新构建理想地提供低系统带宽。音调、信号功率、频谱包络(或共振峰)、振幅及相谱为话音译码参数的实例。话音译码器可实施为时域译码器,其试图通过使用高时间分辨率处理以一次编码较小话音分段(例如,5毫秒(ms)的子帧)来捕获时域话音波形。对于每一子帧,借助于搜索算法找到来自码簿空间的高精确度代表。替代地,话音译码器可实施为频域译码器,其试图通过参数集合(分析)捕获输入话音帧的短期话音频谱及使用对应的合成过程以从频谱参数重新产生话音波形。参数量化器通过根据已知量化技术用所存储的码向量的表示来表示参数而保持参数。一个时域话音译码器为码激发线性预测(CELP)译码器。在CELP译码器中,通过发现短期共振峰滤波器的系数的线性预测(LP)分析来去除话音信号中的短期相关性或冗余。将短期预测滤波器应用于传入话音帧生成LP残余信号,通过长期预测滤波器参数及后续随机码簿对所述LP残余信号进行进一步模型化及量化。因此,CELP译码将编码时域话音波形的任务划分成编码LP短期滤波器系数及编码LP残余的单独任务。可以固定速率(即,对于每一帧,使用相同数目个位No)或可变速率(其中,不同位率用于不同类型的帧内容)执行时域译码。可变速率译码器试图使用将参数编码至足以获得目标质量的等级所需要的位量。例如CELP译码器的时域译码器可依赖于每帧大量位N0以保持时域话音波形的准确性。倘若每帧位计数No相对较大(例如,8kbps或高于8kbps),则这些译码器可递送极好的语音质量。在低位率(例如,4kbps及低于4kbps)下,归因于受限数目个可用位,时域译码器可不能保持高质量及稳固性能。在低位率下,受限码簿空间削减在较高速率商业应用中所部署的时域译码器的波形匹配能力。因此,低位率下的许多CELP译码系统操作遭受表征为噪声的感知显著失真。低位率下对CELP译码器的替代为在类似于CELP译码器的原理下操作的“噪声激发线性预测”(NELP)译码器。NELP译码器使用经滤波伪随机噪声信号来模型化话音而非码簿。由于NELP使用用于经译码话音的较简单模型,因此NELP达成比CELP低的位率。NELP可用于压缩或表示清音话音或静默。以大约为2.4kbps的速率操作的译码系统在本质上通常是参数的。即,这些译码系统通过以常规时间间隔发射描述话音信号的音调周期及频谱包络(或共振峰)的参数进行操作。说明此类参数译码器本文档来自技高网...
高频带激励信号生成

【技术保护点】
一种方法,其包括:在装置处确定输入信号的浊音分类,其中所述输入信号对应于音频信号;基于所述浊音分类控制所述输入信号的表示的包络的量;基于所述包络的所述受控量调制白噪声信号;及基于所述经调制的白噪声信号生成高频带激励信号。

【技术特征摘要】
【国外来华专利技术】2014.04.30 US 14/265,6931.一种方法,其包括:在装置处确定输入信号的浊音分类,其中所述输入信号对应于音频信号;基于所述浊音分类控制所述输入信号的表示的包络的量;基于所述包络的所述受控量调制白噪声信号;及基于所述经调制的白噪声信号生成高频带激励信号。2.根据权利要求1所述的方法,其中控制所述包络的所述量包含控制所述包络的特性。3.根据权利要求2所述的方法,其中所述包络的所述特性包含所述包络的形状、所述包络的量值、所述包络的增益或所述包络的频率范围中的至少一者。4.根据权利要求3所述的方法,其中相比在所述浊音分类对应于强清音时,所述包络的所述形状的变化程度在所述浊音分类对应于强浊音时更大。5.根据权利要求3所述的方法,其中基于应用于所述输入信号的所述表示的滤波器的截止频率控制所述包络的所述频率范围。6.根据权利要求5所述的方法,其进一步包括基于所述浊音分类确定所述截止频率。7.根据权利要求6所述的方法,其中所述滤波器包含低通滤波器,且其中相比在所述浊音分类对应于强清音时,所述截止频率在所述浊音分类对应于强浊音时更大。8.根据权利要求1所述的方法,其中所述装置为解码器或编码器。9.根据权利要求1所述的方法,其中所述包络为时变包络。10.根据权利要求9所述的方法,其中所述包络是每所述输入信号的帧更新超过一次。11.根据权利要求9所述的方法,其中响应于包络调整器接收到所述音频信号的每一样本而更新所述包络。12.根据权利要求1所述的方法,其中通过调整所述输入信号在变换域中的所述表示来调整所述包络。13.根据权利要求1所述的方法,其中所述输入信号的所述表示包含所述音频信号的经编码版本的低频带激励信号或所述音频信号的所述经编码版本的高频带激励信号。14.根据权利要求1所述的方法,其中所述输入信号的所述表示包含谐波性扩展激励信号,且其中由所述音频信号的经编码版本的低频带激励信号生成所述谐波性扩展激励信号。15.根据权利要求1所述的方法,其进一步包括通过组合未经调制的白噪声信号的第一比率与所述经调制的白噪声信号的第二比率来生成经缩放的白噪声信号,其中所述第一比率及所述第二比率是基于所述浊音分类而确定,且其中所述高频带激励信号是基于所述经缩放的白噪声信号。16.一种设备,其包括:浊音分类器,其经配置以确定输入信号的浊音分类,其中所述输入信号对应于音频信号;包络调整器,其经配置以基于所述浊音分类控制所述输入信号的表示的包络的量;调制器,其经配置以基于所述包络的所述受控量调制白噪声信号;及输出电路,其经配置以基于所述经调制的白噪声信号生成高频带激励信号。17.根据权利要求16所述的设备,其中所述包络调整器经配置以基于所述浊音分类控制所述包络的特性,且其中所述包络的所述特性包含所述包络的形状、所述包络的量值、所述包络的增益及所述包络的...

【专利技术属性】
技术研发人员:普拉文·库马尔·拉马达斯丹尼尔·J·辛德尔斯特凡那·皮埃尔·维莱特维韦克·拉金德朗
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1