闭环多模混合域线性预测语音编解码器和处理帧的方法技术

技术编号:3046987 阅读:182 留言:0更新日期:2012-04-11 18:40
一种闭环多模混合域线性预测(MDLP)语音编解码器包括高速率时域编解码模式、低速率频域编解码模式和根据输入到编解码器的帧的语音内容选择编解码模式的闭环模式选择机制。用高速率时域模式(可能是某种CELP编码模式)对过渡语音(即从无声语音到有声语音,或反之)帧编码。用低速率频域编码模式(可能是某种谐波编码模式)对有声语音编码。相位参数不由频域模式编码,而是按照(如)某种二次相位模型模拟。对每个按频域编码模式的语音帧,初始相位值取紧接在前的按频域编码模式的语音帧的初始相位值。如果紧接在前的语音帧按时域编码模式,则从紧接至前的时域编码的语音帧的解码信息计算当前帧的初始相位值。每个按频域编码模式的语音帧都可以与相应的输入语音帧相比较,以获取性能测量值。如果该性能测量值低于某个预定阈值,则该输入语音帧按时域编码模式。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般关于语音处理领域,特别是关于一种闭环、多模、混合域语音编解码的方法和设备。背景利用数字技术的话音传输已变得很广泛,尤其在长途和数字无线电话的应用上。这种情况反过来引起了对确定在维持再现语音感知品质的前提下可以在信息上发送信息的最少数量的兴趣。如果只是简单地取样和数字化后传输语言,就需要数量级为每秒64千比特(kbps)的数据速率来获得常规模拟电话的语音品质。可是,通过语音分析的使用,以及适当的编解码、传输和在接收方的重新合成,可以获得显著降低的数据速率。把通过析取与人类发音模型有关的参数,使用技术来压缩语音的设备称为语音编解码器。语音编解码器可以将输入的语音信号分解为时间块或分析帧。语音编解码器一般包括一个编码器和一个解码器。编码器分析输入的语音帧,以析取某些相关参数,然后将这些参数量化成二进制表示,即量化成比特组或二进制数据分组。数据分组通过通信信道传输到接收机和解码器。解码器处理这些数据分组,将其去除量化以产生参数,并使用这些去除量化了的参数重新合成语音帧。语音编解码器的功能是通过清除所有语音中固有的自然冗余,将数字化语音信号压缩成某种低比特率的信号。通过用一本文档来自技高网...

【技术保护点】
一种多模混合域语音处理器,其特征在于,包括: 编解码器,它具有至少一种时域编解码模式和至少一种频域编解码模式;和 闭环模式选择装置,它与编解码器相连,并配置成根据语音处理器所处理的帧的内容为编解码器选择编解码模式。

【技术特征摘要】
【国外来华专利技术】1.一种多模混合域语音处理器,其特征在于,包括编解码器,它具有至少一种时域编解码模式和至少一种频域编解码模式;和闭环模式选择装置,它与编解码器相连,并配置成根据语音处理器所处理的帧的内容为编解码器选择编解码模式。2.如权利要求1所述的语音处理器,其特征在于,编解码器对语音帧进行编码。3.如权利要求1所述的语音处理器,其特征在于,编解码器对语音帧的线性预测剩余进行编码。4.如权利要求1所述的语音处理器,其特征在于,至少一种时域编解码模式包括一种按第一种编码速率对帧进行编解码的编解码模式,以及至少一种频域编解码模式包括一种按第二种编码速率对帧进行编解码的编解码模式,第二种编码速率小于第一种编码速率。5.如权利要求1所述的语音处理器,其特征在于,至少一种频域编解码模式包括一种谐波编解码模式。6.如权利要求1所述的语音处理器,其特征在于,进一步包括与编解码器相连的比较电路,用来对未编码帧和按至少一种频域编解码模式编码的帧进行比较,并根据比较结果产生性能测量值,其中,只有该性能测量值低于预定阈值时,编解码器才应用至少一种时域编解码模式,否则编解码器应用该至少一种频域编解码模式。7.如权利要求1所述的语音处理器,其特征在于,在连续处理以至少一种频域编解码模式编解码的帧达到某一预定数量后,编解码器对紧接着的一帧应用至少一种时域编解码模式。8.如权利要求1所述的语音处理器,其特征在于,至少一种频域编解码模式用多个各具一组包括频率、相位和振幅的参数的正弦波表示每个帧的短期频谱,其中相位由一个多项表达式和一个初始相位值来模拟,其中初始相位值或者是(1)如果前一帧以至少一种频域编解码模式编解码,则取前一帧的最终估计相位值,或者是(2)如果前一帧以该至少一种时域编解码模式编解码,则取从前一帧的短期频谱获取的某个相位值。9.如权利要求8所述的语音处理器,其特征在于,每一帧的正弦波频率是该帧的间距频率的整数倍。10.如权利要求8所述的语音处理器,其特征在于每一帧的正弦波频率从一组0到2π之间的实数中提取。11.一种处理帧所述的方法,其特征在于,包括下列步骤对每个连续输入帧应用开环编解码模式选择过程,以根据输入帧的语音内容选择一种时域编解码模式或一种频域编解码模式;如果输入帧的语音内容表示为稳定状态的有声语音,则对该输入帧进行频域编解码;如果输入帧的语音内容表示为除稳定状态有声语音外的任何其它内容,则对该输入帧进行时域编解码;比较以频域编解码的帧和输入帧,以获取一个性能测量值;和如果该性能测量值低于预定的阈值,则对该输入帧进行时域编解码。12.如权利要求11所述的方法,其特征在于,这些帧都是线性预测剩余帧。13.如权利要求11所述的方法,其特征在于,这些帧都是语音帧。...

【专利技术属性】
技术研发人员:A达斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1