语音编码、解码方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35174112 阅读:11 留言:0更新日期:2022-10-12 17:39
本申请涉及一种语音编码、解码方法、装置、计算机设备和存储介质,包括:基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号;基于子带激励信号各频点的频点特征,确定子带激励信号的听觉感知表征值;基于听觉感知表征值与预设的听觉感知门限值之间的大小关系,从至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号;确定第一子带激励信号相对于单位激励信号的目标增益;将目标增益确定为第一子带激励信号对应的目标编码参数,以屏蔽对第一子带激励信号的量化编码;获取对第二子带激励信号进行量化编码得到的激励量化信号,根据目标编码参数和激励量化信号得到目标编码数据。采用本方法能够提高语音编码效率。音编码效率。音编码效率。

【技术实现步骤摘要】
语音编码、解码方法、装置、计算机设备和存储介质


[0001]本申请涉及语音处理
,特别是涉及一种语音编码方法、装置、计算机设备、存储介质和计算机程序产品,以及一种语音解码方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]语音编码在日常通信中有着较为广泛的应用,所谓语音编码,是指在保证语音高质量传输的情况下,降低语音传输所需要的信道带宽。例如,在语音通话的应用中,发送端采集语音数据,对语音数据进行编码,将编码后的数据发送至接收端,以使接收端可以通过解码重新生成语音数据,播放出声音。
[0003]目前,语音编码技术主要分为三类:波形编码、参数编码和混合编码。具体的,波形编码是将语音数据作为一般波形数据处理,以使重建的语音波形保持原有波形形状。参数编码是通过对语音数据特征参数的提取和编码,以保证重建的语音数据保持原语音的语义。混合编码,将波形编码和参数编码进行结合,既包含了语音特征参数,也包含了波形编码信息。然而,目前的语音编码方法存在编码效率低的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高语音编码效率的语音编码方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,另外,本申请还提供一种语音解码方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]一方面,本申请提供了一种语音编码方法。所述方法包括基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号;基于所述子带激励信号各频点的频点特征,确定所述子带激励信号的听觉感知表征值;所述听觉感知表征值用于描述所述子带激励信号的听觉感知强弱;基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系,从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号;确定所述第一子带激励信号相对于单位激励信号的目标增益;所述单位激励信号用于针对所述第一子带激励信号进行信号还原;将所述目标增益确定为所述第一子带激励信号对应的目标编码参数,以屏蔽对所述第一子带激励信号的量化编码;获取对所述第二子带激励信号进行量化编码得到的激励量化信号,根据所述目标编码参数和所述激励量化信号,确定所述初始语音信号对应的目标编码数据。
[0006]另一方面,本申请还提供了一种语音编码装置。所述装置包括:子带分解模块,用于基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号;听觉感知确定模块,用于基于所述子带激励信号各频点的频点特征,确定所述子带激励信号的听觉感知表征值;所述听觉感知表征值用于描述所述子带激励信号的听觉感知强弱;子带分类模块,用于基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系,从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号;增益确定模块,用于确定所
述第一子带激励信号相对于单位激励信号的目标增益;所述单位激励信号用于针对所述第一子带激励信号进行信号还原;编码参数确定模块,用于将所述目标增益确定为所述第一子带激励信号对应的目标编码参数,以屏蔽对所述第一子带激励信号的量化编码;量化编码模块,用于获取对所述第二子带激励信号进行量化编码得到的激励量化信号,根据所述目标编码参数和所述激励量化信号,确定所述初始语音信号对应的目标编码数据。
[0007]另一方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述语音编码方法的步骤。
[0008]另一方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音编码方法的步骤。
[0009]另一方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述语音编码方法的步骤。
[0010]上述语音编码方法、装置、计算机设备、存储介质和计算机程序产品,基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号,基于子带激励信号各频点的频点特征,确定子带激励信号的听觉感知表征值,基于听觉感知表征值与预设的听觉感知门限值之间的大小关系,从至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号,确定第一子带激励信号相对于单位激励信号的目标增益;单位激励信号用于针对第一子带激励信号进行信号还原,将目标增益确定为第一子带激励信号对应的目标编码参数,以屏蔽对第一子带激励信号的量化编码,获取对第二子带激励信号进行量化编码得到的激励量化信号,根据目标编码参数和激励量化信号,确定初始语音信号对应的目标编码数据,由于听觉感知表征值用于描述子带激励信号的听觉感知强弱,而听觉感知的强弱可以表达子带激励信号对初始语音信号的听觉感知贡献,因此本申请可以实现通过听觉感知门限值选择出听觉感知贡献较低的子带激励信号,对这些子带激励信号不进行量化编码,仅传输目标增益,在提高编码效率的同时,极大的节省了编码带宽。另一方面,本申请提供了一种语音解码方法。所述方法包括:获取对初始语音信号进行编码得到的目标编码数据,解析所述目标编码数据得到目标增益和激励量化信号,所述目标增益对应于基于初始语音信号进行子带分解得到的至少两个子带激励信号中的第一子带激励信号,所述激励量化信号对应于所述至少两个子带激励信号中的第二子带激励信号,所述目标增益是所述第一子带激励信号相对于单位激励信号的增益;所述第一子带激励信号和所述第二子带激励信号,是根据所述至少两个子带激励信号中各个子带激励信号的听觉感知表征值与听觉感知门限值之间的大小关系确定的;所述听觉感知表征值用于描述子带激励信号的听觉感知强弱,是基于子带激励信号各频点的频点特征确定的;根据单位激励信号以及所述目标增益进行信号还原,得到第一激励还原信号;根据所述激励量化信号进行信号还原,得到第二激励还原信号;基于所述第一激励还原信号和所述第二激励还原信号进行信号子带合成,以得到目标语音信号。
[0011]另一方面,本申请还提供了一种语音解码装置。所述装置包括:目标编码数据获取模块,用于获取对初始语音信号进行编码得到的目标编码数据,解析所述目标编码数据得到目标增益和激励量化信号,所述目标增益对应于基于初始语音信号进行子带分解得到的至少两个子带激励信号中的第一子带激励信号,所述激励量化信号对应于所述至少两个子
带激励信号中的第二子带激励信号,所述目标增益是所述第一子带激励信号相对于单位激励信号的增益;所述第一子带激励信号和所述第二子带激励信号,是根据所述至少两个子带激励信号中各个子带激励信号的听觉感知表征值与听觉感知门限值之间的大小关系确定的;所述听觉感知表征值用于描述子带激励信号的听觉感知强弱,是基于子带激励信号各频点的频点特征确定的;信号还原模块,用于根据单位激励信号以及所述目标增益进行信号还原,得到第一激励还原信号;根据所述激励量化信号进行信号还原,得到第二激励还原信号;子带合成模块,用于基于所述第一激励还原信号和所述第二激励还原信号进行信号子带合成,以得到目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音编码方法,其特征在于,所述方法包括:基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号;基于所述子带激励信号各频点的频点特征,确定所述子带激励信号的听觉感知表征值;所述听觉感知表征值用于描述所述子带激励信号的听觉感知强弱;基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系,从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号;确定所述第一子带激励信号相对于单位激励信号的目标增益;所述单位激励信号用于针对所述第一子带激励信号进行信号还原;将所述目标增益确定为所述第一子带激励信号对应的目标编码参数,以屏蔽对所述第一子带激励信号的量化编码;获取对所述第二子带激励信号进行量化编码得到的激励量化信号,根据所述目标编码参数和所述激励量化信号,确定所述初始语音信号对应的目标编码数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述子带激励信号各频点的频点特征,确定所述子带激励信号的听觉感知表征值,包括:获取所述子带激励信号各频点各自的功率谱;获取所述子带激励信号各频点各自的听觉感知系数;其中,所述听觉感知系数与听觉响度成正相关,所述听觉响度用于描述声音的响亮程度;基于各频点各自的听觉感知系数对各频点各自的功率谱进行加权处理,以得到所述子带激励信号的听觉感知表征值。3.根据权利要求2所述的方法,其特征在于,所述获取所述子带激励信号各频点各自的听觉感知系数,包括:对声学等响曲线数据进行线性插值,得到各频点各自的听觉响度;所述声学等响曲线数据用于描述等响条件下声压级与声波频率之间的对应关系;根据各频点各自的听觉响度,确定各频点各自的听觉感知系数。4.根据权利要求1所述的方法,其特征在于,所述基于所述听觉感知表征值与预设的听觉感知门限值之间的大小关系,从所述至少两个子带激励信号中确定第一子带激励信号和第二子带激励信号,包括:在所述听觉感知表征值小于或者等于所述预设的听觉感知门限值的情况下,将所述子带激励信号确定为第一子带激励信号;在所述听觉感知表征值大于所述预设的听觉感知门限值的情况下,将所述子带激励信号确定为第二子带激励信号。5.根据权利要求1所述的方法,其特征在于,确定所述第一子带激励信号相对于单位激励信号的目标增益,包括:基于所述第一子带激励信号各样点的幅值,确定所述第一子带激励信号对应的能量值;获取单位激励信号对应的预设能量值,基于所述第一子带激励信号对应的能量值以及所述预设能量值,确定所述第一子带激励信号相对于单位激励信号的目标增益。6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述第二子带激励信号包括多个,所述获取对所述第二子带激励信号进行量化编码得到的激励量化信号,包括:
按照听觉感知表征值从大到小对各个第二子带激励信号进行排序;基于各个第二子带激励信号各自的排序位置,按照不同的量化精度对各个第二子带激励信号进行量化编码,得到各个第二子带激励信号各自的激励量化信号;其中,至少一个排序位置在后的第二子带激励信号的量化精度小于排序位置在前的第二子带激励信号的量化精度。7.根据权利要求6所述的方法,其特征在于,所述按照不同的量化精度对各个第二子带激励信号进行量化编码,得到各个第二子带激励信号各自的激励量化信号包括:基于所述第二子带激励信号的排序位置,确定所述第二子带激励信号的目标增益;其中,至少一个排序位置在后的第二子带激励信号的目标增益大于排序位置在前的第二子带激励信号的目标增益;基于所述第二子带激励信号的目标增益,对所述第二子带激励信号进行量化编码,得到所述第二子带激励信号的激励量化信号。8.根据权利要求7所述的方法,其特征在于,所述基于所述第二子带激励信号的排序位置,确定所述第二子带激励信号的目标增益,包括:获取初始增益,所述初始增益是基于所述初始语音信号计算得到的;对所述初始增益按照预设的增益递增方式依次进行递增,得到多个目标增益,基于各个第二子带激励信号的排序位置,将所述多个目标增益分配给各个第二子带激励信号;所述根据所述目标编码参数和所述激励量化信号,确定所述初始语音信号对应的目标编码数据,包括:根据所述目标编码参数、所述激励量化信号和所述初始增益,确定所述初始语音信号对应的目标编码数据。9.根据权利要求1所述的方法,其特征在于,所述基于待编码的初始语音信号进行子带分解,得到至少两个子带激励信号,包括:对待编码的初始语音信号进行分帧处理,得到多帧子语音信号;对所述子语音信号进行信号分析处理和滤波处理,以得到所述子语音信号...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1