音质转换的模型训练方法、提升语音音质的方法及装置制造方法及图纸

技术编号：34432199 阅读：28 留言：0更新日期：2022-08-06 16:11

本申请公开了一种音质转换的模型训练方法、提升语音音质的方法及装置，属于语音编解码技术领域。该方法主要包括：对高音质语音进行加窗与低延迟改进型离散余弦变换获取训练高音质谱系数；根据预设高压缩率的语音编解码器对高音质语音进行特征提取获取训练低音质谱系数；将训练低音质谱系数输入神经网络模型中获取转换高音质谱系数，计算训练高音质谱系数与转换高音质谱系数的差值；根据差值对神经网络模型进行训练，获得音质转换模型。通过在进行语音通话的蓝牙设备的编解码装置中加入上述音质转换模型，将低音质语音转换为高音质语音，使得蓝牙设备接收的经高压缩率压缩导致受损的语音也能转换为音质较高的语音，提高用户体验感。户体验感。户体验感。

全部详细技术资料下载

【技术实现步骤摘要】
音质转换的模型训练方法、提升语音音质的方法及装置

[0001]本申请涉及语音编解码
，特别涉及一种音质转换的模型训练方法、提升语音音质的方法及装置。

技术介绍

[0002]目前世界上很多地区仍然在使用第二代移动通信网络（简称2G）和第三代移动通信网络（简称3G），伴随着2G与3G网络的是窄带语音信号的广泛使用；在相关的技术中，广泛使用的语音编解码的型号包括：（1）GSM
‑
HR，该型号的语音编解码器的采样率为8kHz，码率为6.5kbps；GSM
‑
FR，该型号的语音编解码器的采样率为8kHz，码率为13kHz；GSM
‑
EFR，该型号的语音编解码器的采样率为8kHz，码率为13kHz；AMR，该型号的语音编解码器的采样率为8kHz，码率为4.75~12.2kbps；EVRC
‑
A，该型号的语音编解码器的采样率为8kHz，平均码率约为5kbps；EVRC
‑
B，该型号的语音编解码器的采样率为8kHz，平均码率约为4kbps。
[0003]相对于蓝牙通信中使用的型号为CVSD和mSBC的码率为64kbps的编解码器，以及LC3要求的最低码率16kbps；上述的2G与3G网络中使用的语音编解码器的压缩率较高，然而较高的压缩率虽然提高了移动通信的网络容量，但是压缩的过程损失了语音信息，导致语音的音质受损，尤其造成人声辨识度的损失。
[0004]例如，在2G与3G网络的通信过程中，当近端手机使用蓝牙通话时，若与该近...

【技术保护点】

【技术特征摘要】
1.一种音质转换的模型训练方法，其特征在于，包括：对预设的高音质语音进行加窗与低延迟改进型离散余弦变换，获取所述高音质语音对应的训练高音质谱系数；根据预设高压缩率的语音编解码器对所述高音质语音进行特征提取，获取所述高音质语音对应的训练低音质谱系数；将所述训练低音质谱系数输入预设的神经网络模型中获取转换高音质谱系数，计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值；以及根据所述差值对所述神经网络模型进行训练，获得音质转换模型。2.根据权利要求1所述的音质转换的模型训练方法，其特征在于，所述根据预设高压缩率的语音编解码器对所述高音质语音进行特征提取，获取所述高音质语音对应的训练低音质谱系数，进一步包括：利用所述语音编解码器对所述高音质语音进行编解码，获取所述高音质语音对应的训练低音质语音；对所述训练低音质语音进行所述加窗与所述低延迟改进型离散余弦变换，获取所述训练低音质语音对应的所述训练高音质谱系数。3.根据权利要求2所述的音质转换的模型训练方法，其特征在于，所述利用所述语音编解码器对所述高音质语音进行编解码，获取所述高音质语音对应的训练低音质语音之前，还包括：根据预设带宽的滤波器，对所述高音质语音进行窄带滤波。4.根据权利要求1
‑
3任一项所述的音质转换的模型训练方法，其特征在于，所述对预设的高音质语音进行加窗与低延迟改进型离散余弦变换，获取所述高音质语音对应的训练高音质谱系数之前，还包括：对所述高音质语音进行分帧，获取所述高音质语音对应的每一帧语音；利用所述每一帧语音分别获取所述训练高音质谱系数与所述训练低音质谱系数。5.根据权利要求1所述的音质转换的模型训练方法，其特征在于，所述将所述训练低音质谱系数输入预设的神经网络模型中获取转换高音质谱系数，计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值，进一步包括：所述神经网络模型将所述训练低音质谱系数转换为第N转换高音质谱系数，其中所述转换高音质谱系数包括所述第N转换高音质谱系数，所述N为大于0的自然数；计算所述第N转换高音质谱系数与所述训练高音质谱系数的第N差值，其中所述差值包括所述第N差值。6.根据权利要求5所述的音质转换的模型训练方法，其特征在于，所述根据所述差值对所述神经网络模型进行训练，获得音质转换模型，进一步包括：将所述第N差值与预设差值进行对比；若所述第N差值大于所述预设差值，则对所述神经网络模型中的相关参数进行调整，获取所述音质转换模型；若所述第N差值小于或等于所述预设差值，则将所述神经网络模型确定为所述音质转换模型。7.根据权利要求6所述的音质转换的模型训练方法，其特征在于，所述对所述神经网络
模型中的相关参数进行调整，获取所述神经网络模型，进一步包括：根据所述第N差值对所述相关参数进行调整，获取第N更新神经网络模型；将所述训练低音质谱...

【专利技术属性】
技术研发人员：李强，王尧，叶东翔，朱勇，
申请(专利权)人：北京百瑞互联技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人