语音参数量化方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20179357 阅读:29 留言:0更新日期:2019-01-23 01:12
本申请涉及一种语音参数量化方法、装置、计算机设备和存储介质。所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。采用本方法能够可以针对不同的传输速率和语音参数灵活设置不同的量化方法,适用于不同的场景中,满足用户的不同需求。

Speech parameter quantization methods, devices, computer equipment and storage media

This application relates to a speech parameter quantization method, device, computer equipment and storage medium. The method includes: acquiring speech parameters of speech signals by preset parameter analysis method; determining the quantization method corresponding to the speech parameters according to the transmission rate of the speech signals and the speech parameters to quantify the speech parameters. With this method, different quantization methods can be set flexibly for different transmission rates and voice parameters, and can be applied to different scenarios to meet the different needs of users.

【技术实现步骤摘要】
语音参数量化方法、装置、计算机设备和存储介质
本申请涉及音频编码
,特别是涉及一种语音参数量化方法、装置、计算机设备和存储介质。
技术介绍
声码器是一种对话音进行分析和合成的编译码器,也称话音分析合成系统或话音频带压缩系统,是压缩话音通信频带和进行保密通信的有力工具。声码器可以分为编码器和解码器,编码器将音频信号转化为比特流用于信道传输,解码器从比特流中恢复出用于语音合成的参数进行语音合成,输出音频数据。目前,编码器常用的语音参数量化方法包括互联网低比特率编码(InternetLowBitrateCodec,ILBC)、增强型可变速率编解码器(EnhancedVariableRateCodec,EVRC)、自适应多速率语音编码(AdaptiveMultiRate,AMR)等方法。但是,上述语音参数量化方法不够灵活,不能适应各种场景。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够灵活适应多种场景的语音参数量化方法、装置、计算机设备和存储介质。一种语音参数量化方法,所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为基音周期,则根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化。在其中一个实施例中,所述根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化,包括:若所述当前帧为浊音帧,则对所述语音信号在所述当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化。在其中一个实施例中,若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化,包括:若所述当前帧为清音帧,则将所述语音信号的基音周期对应的比特位均量化为第一值;若所述语音信号的周期属性为非周期,则将所述语音信号的基音周期对应的比特位均量化为第二值。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为线谱对LSF参数,则采用预设的三级矢量码本对所述LSF参数进行量化。在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为1200bps,则根据传输所述语音信号的时间帧的清浊类型确定所述语音信号的超帧模式;根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化。在其中一个实施例中,所述根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音参数为LSF参数,则根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中至少包括两个浊音帧,则采用预设的三级量化码本对当前超帧中第三帧的LSF参数进行量化,并根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,对第一帧和第二帧的LSF参数进行量化,所述第三帧为所述超帧模式中时序上位于最后的时间帧。在其中一个实施例中,所述根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,对第一帧和第二帧的LSF参数进行量化,包括:根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,确定预测系数码本中的每个预测系数对应的第一帧的LSF参数量化值和第二帧的LSF参数量化值;根据所述第一帧的LSF参数、所述第二帧的LSF参数、所述第一帧的LSF参数量化值和所述第二帧的LSF参数量化值,确定目标预测系数;根据所述目标预测系数确定残差矢量,并采用预设的二级矢量码本对所述残差矢量进行量化。在其中一个实施例中,根据所述第一帧的LSF参数、所述第二帧的LSF参数、所述第一帧的LSF参数量化值和所述第二帧的LSF参数量化值,确定目标预测系数,包括:根据所述第一帧的LSF参数、所述第二帧的LSF参数、所述第一帧的LSF参数量化值和所述第二帧的LSF参数量化值,确定所述预测系数码本中的每个预测系数对应的预测误差;确定最小的预测误差对应的预测系数为所述目标预测系数。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括一个浊音帧,则采用预设的三级矢量码本对所述超帧模式中浊音帧的LSF参数进行量化,采用预设的一级矢量码本对所述超帧模式中清音帧的LSF参数进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,则采用预设的一级矢量码本对所述超帧模式中清音帧的LSF参数进行量化。在其中一个实施例中,所述根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音参数为基音周期和清浊类型,则根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧均为清音帧,则将所述基音周期和清浊类型对应的比特位均量化为第二值。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧包括一个清音帧,则将所述清浊类型对应的比特位均量化为第二值,将所述超帧模式中浊音帧的基音周期进行对数转换,并根据转换结果和所述清浊类型确定目标量化值。在其中一个实施例中,所述根据转换结果和所述清浊类型确定目标量化值,包括:对所述转换结果进行均匀量化,获取均匀量化系数;根据所述均匀量化系数、所述清浊类型与预设的码本序号之间的对应关系,确定所述目标量化值。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行量化,包括:若所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中包括两个浊音帧,则将所述浊音帧的清浊类型对应的比特位量化为第二值,将所述清音帧的清浊类型对应的比特位量化为第一值;并采用预设的矢量码本对所述三个相邻的时间帧的基音周期进行量化。在其中一个实施例中,所述根据所述超帧模式,采用预设的比特量化方法对所述基音周期和清浊类型进行本文档来自技高网...

【技术保护点】
1.一种语音参数量化方法,所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。

【技术特征摘要】
1.一种语音参数量化方法,所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。2.根据权利要求1所述的方法,其特征在于,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为基音周期,则根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化。3.根据权利要求2所述的方法,其特征在于,所述根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化,包括:若所述当前帧为浊音帧,则对所述语音信号在所述当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化。4.根据权利要求3所述的方法,其特征在于,若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化,包括:若所述当前帧为清音帧,则将所述语音信号的基音周期对应的比特位均量化为第一值;若所述语音信号的周期属性为非周期,则将所述语音信号的基音周期对应的比特位均量化为第二值。5.根据权利要求1所述的方法,其特征在于,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为2400bps,且所述语音参数为线谱对LSF参数,则采用预设的三级矢量码本对所述LSF参数进行量化。6.根据权利要求1所述的方法,其特征在于,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音信号的传输速率为1200bps,则根据传输所述语音信号的时间帧的清浊类型确定所述语音信号的超帧模式;根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化。7.根据权利要求6所述的方法,其特征在于,所述根据所述语音参数和所述超帧模式,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:若所述语音参数为LSF参数,则根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化。8.根据权利要求7所述的方法,其特征在于,所述根据所述超帧模式,采用预设的码本量化方法对所述LSF参数进行量化,包括:所述超帧模式包括三个相邻的时间帧,且所述三个相邻的时间帧中至少包括两个浊音帧,则采用预设的三级量化码本对当前超帧中第三帧的LSF参数进行量化,并根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,对第一帧和第二帧的LSF参数进行量化,所述第三帧为所述超帧模式中时序上位于最后的时间帧。9.根据权利要求8所述的方法,其特征在于,所述根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,对第一帧和第二帧的LSF参数进行量化,包括:根据前一超帧中第三帧的LSF参数量化值和所述当前超帧中第三帧的LSF参数量化值,确定预测系数码本中的每个预测系数对应的第一帧的LSF参数量化值和第二帧的LSF参数量化值;根据所述第一帧的LSF参数、所述第二帧的LSF参数、所述第一帧的LSF参数量化值和所述第二帧的LSF参数量化值,确定目标预测系数;根据所述目标预测系数确定残差矢量,并采用预设的二级矢量码本对所述残差矢量进行量化。10.根据权利要求9所述的方法,其特征在于,根据所述第一帧的LSF参数、所述第二帧的LSF参数、所述第一帧的LSF参数量化值和所述第二帧的LSF参数量化值,确定目标预测系...

【专利技术属性】
技术研发人员:袁念德
申请(专利权)人:西安蜂语信息科技有限公司
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1