音质转换的模型训练方法、提升音质的方法、装置及介质制造方法及图纸

技术编号：34432194 阅读：21 留言：0更新日期：2022-08-06 16:11

本申请公开了一种音质转换的模型训练方法、提升音质的方法、装置及介质，属于音频编解码技术领域。该方法主要包括：根据高码率与低码率分别对高音质音频进行特征提取获取训练高音质谱系数与训练低音质谱系数；将训练低音质谱系数输入预设的神经网络模型输出转换高音质谱系数，计算高音质谱系数与转换高音质谱系数的差值；根据差值训练神经网络模型获得音质转换模型。通过提供音质转换模型无需对低音质音频进行额外的编解码，在蓝牙无线设备装置自身的解码装置中加入音质转换模型，将质量不佳的低音质音频转换为高音质音频输出，使得即使在地铁、飞机场等干扰较多的场合，无线链路质量不佳的状况下，也能获取音质较高的音频，提高用户体验感。提高用户体验感。提高用户体验感。

全部详细技术资料下载

【技术实现步骤摘要】
音质转换的模型训练方法、提升音质的方法、装置及介质

[0001]本申请涉及音频编解码
，特别涉及一种音质转换的模型训练方法、提升音质的方法、装置及介质。

技术介绍

[0002]由于在音频播放前，手机、平板电脑、蓝牙发射器等蓝牙发射端与蓝牙耳机等蓝牙接收端之间通信的相关参数，根据该蓝牙发射端与该蓝牙接收端所在环境得无线链路的质量确定，其中相关参数包括但不限于音频压缩的码率；无线链路的质量与相关参数的大小呈正相关，即无线链路的质量高，则为音频压缩设置较高的码率，无线链路的质量低，则为音频压缩设置较低的码率；较高的码率则意味着该蓝牙发射端与该蓝牙接收端在传输音频的过程中，音质的损失较小。
[0003]然而，由于所述的环境不同，对应的无限链路质量的高低不同；其中，在蓝牙通信设备较多的环境中，例如地铁、飞机场、火车站等人员密集、蓝牙设备较多的场所，无线链路的质量较低，导致蓝牙接收端播放的音频的音质降低，影响用户体验。
[0004]在相关技术中涉及音质受损的场景多为在不同声道中转换音频时，使得音频的音质受损，或多个蓝牙设备同时与同一辆车辆进行蓝牙传输时导致的音质受损的情况，因此其解决的技术问题也是针对于上述的特定场景而言的音质提升，而对上述场景所适用的音质提升的方法并不适用与本方案所在的场景，直接套用在本方案所使用的场景中，并不能有效的实现音质提升的效果。因此，需要一种适用于本方案的音质提升的方法。

技术实现思路

[0005]针对现有技术存在的在蓝牙通信设备较多的环境中，无线链路的质量较低，...

【技术保护点】

【技术特征摘要】
1.一种音质转换的模型训练方法，其特征在于，包括：根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取，获取所述高音质音频分别对应的训练高音质谱系数与训练低音质谱系数；将所述训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数，计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值；以及根据所述差值对所述神经网络模型进行训练，获得音质转换模型。2.根据权利要求1所述的音质转换的模型训练方法，其特征在于，所述根据预设的高码率与预设的低码率分别对预设的高音质音频进行特征提取，获取所述高音质音频分别对应的训练高音质谱系数与训练低音质谱系数，进一步包括：根据所述高码率与所述低码率分别对所述高音质音频进行编码，获取所述高音质音频分别对应的训练高音质码流与训练低音质码流，其中，所述低码率小于所述高码率；利用标准的LC3解码器对所述训练高音质码流与所述训练低音质码流分别进行解码，直至变换域噪声整形模块输出所述训练高音质谱系数与所述训练低音质谱系数。3.根据权利要求1所述的音质转换的模型训练方法，其特征在于，所述将所述训练低音质谱系数输入预设的神经网络模型获取转换高音质谱系数，计算所述训练高音质谱系数与所述转换高音质谱系数之间的差值，进一步包括：所述神经网络模型将所述训练低音质谱系数转换为第N转换高音质谱系数，其中所述转换高音质谱系数包括所述第N转换高音质谱系数，所述N为大于0的自然数；计算所述第N转换高音质谱系数与所述训练高音质谱系数的第N差值，其中所述差值包括所述第N差值。4.根据权利要求3所述的音质转换的模型训练方法，其特征在于，所述根据所述差值对所述神经网络模型进行训练，获得音质转换模型，进一步包括：将所述第N差值与预设差值进行对比；若所述第N差值大于所述预设差值，则对所述神经网络模型中的相关参数进行调整，获取所述音质转换模型；若所述第N差值小于或等于所述预设差值，则将所述神经网络模型确定为所述音质转换模型。5.根据权利要求4所述的音质转换的模型训练方法，其特征在于，所述对所述神经网络模型中的相关参数进行调整，获取所述神经网络模型，进一步包括：根据所述第N差值对所述相关参数进行调整，获取第N更新神经网络模型；将所述训练低音质谱系输入所述第N更新神经网络模型，获取所述训练低音质谱系数对应的第N+1转换高音质谱系数；计算所述训练高音质谱系数与所述第N+1转换高音质谱系数之间的第N+1差值；所述第N+1差值小于或等于所述预设差值，则将所述N+1更新神经网络模型确定为所述音质转换模型。6.根据权利要求5所述的音质转换的模型训练方法，其特征在于，根据若所述第N差值大于所述预设差值，还包括：记录所述神经网络模型的训练次数N；...

【专利技术属性】
技术研发人员：李强，王尧，叶东翔，朱勇，
申请(专利权)人：北京百瑞互联技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人