基于神经网络的语音丢包补偿方法和装置制造方法及图纸

技术编号：41583339 阅读：25 留言：0更新日期：2024-06-06 23:58

本公开实施例提供了一种基于神经网络的语音丢包补偿方法和装置。该方法的一具体实施方式包括：获取预先训练得到的用于进行语音丢包补偿的神经网络；接收待处理音频和所述待处理音频对应的丢帧位置信息；将基于所述待处理音频和所述待处理音频对应的丢帧位置信息生成的输入特征，输入所述神经网络，得到所述待处理音频对应的丢包补偿后的音频。

全部详细技术资料下载

【技术实现步骤摘要】

本公开实施例涉及计算机，尤其涉及一种基于神经网络的语音丢包补偿方法和装置。

技术介绍

1、随着互联网技术和通讯技术的发展，音频流传输已经成为了网络通信的一个非常重要的部分。实践中，由于各种因素，比如网络拥堵、带宽限制、硬件故障等等，音频数据包在传输过程中可能会丢失，这会对语音通信的质量产生严重影响，造成用户体验下降。因此，对音频丢包进行修补恢复是亟需解决的问题。

技术实现思路

1、本公开的实施例描述了一种基于神经网络的语音丢包补偿方法和装置，通过该方法训练得到的神经网络，可以更加准确的进行语音丢包补偿。

2、根据第一方面，提供了一种训练用于进行语音丢包补偿的神经网络的方法，其中，待训练神经网络包括编码器层、中间层和解码器层，上述中间层连接于上述编码器层和上述解码器层之间，上述方法包括：获取训练样本集，其中，各训练样本包括样本丢包音频、及其对应的样本丢帧位置信息和样本未丢包音频；基于样本丢包音频及其对应的样本丢帧位置信息，生成输入特征；将上述输入特征输入上述待训练神经网络；将上述...

【技术保护点】

1.一种基于神经网络的语音丢包补偿方法，包括：

2.一种训练用于进行语音丢包补偿的神经网络的方法，其中，待训练神经网络包括编码器层、中间层和解码器层，所述中间层连接于所述编码器层和所述解码器层之间，所述方法包括：

3.根据权利要求2所述的方法，其中，所述待训练神经网络为U-Net结构的神经网络，其中，所述中间层为所述U-Net结构中的瓶颈层。

4.根据权利要求2所述的方法，其中，所述基频预测网络包括双向长短期记忆网络。

5.根据权利要求2所述的方法，其中，所述中间层输出的特征包括样本丢帧位置信息对应的丢帧位置所对应帧的特征，所述基频预测网络...

【技术特征摘要】

1.一种基于神经网络的语音丢包补偿方法，包括：

3.根据权利要求2所述的方法，其中，所述待训练神经网络为u-net结构的神经网络，其中，所述中间层为所述u-net结构中的瓶颈层。

4.根据权利要求2所述的方法，其中，所述基频预测网络包括双向长短期记忆网络。

5.根据权利要求2所述的方法，其中，所述中间层输出的特征包括样本丢帧位置信息对应的丢帧位置所对应帧的特征，所述基频预测网络输出的预测基频包括丢帧位置所对应帧的基频。

6.根据权利要求2所述的方法，其中，所述基于样本丢包音频及其对应的样本丢帧位置信息，生成输入特征，包括：

7.根据权利要求2所述的方法，其中，所述编码器层包括多个编码器，各编码器包括门控卷积层和时频空洞卷积层，所述时频空洞卷积层用于通过时间维度和频率维度的空洞卷积来提取特征。

8.根据权利要求2所述的方法，其中，所述解码器层包括多个...

【专利技术属性】
技术研发人员：夏咸军，张子晗，肖益剑，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人