【技术实现步骤摘要】
一种语音处理方法、装置、设备及存储介质
本申请涉及互联网
,具体涉及VoIP(VoiceoverInternetProtocol,基于IP的语音传输)通话
,尤其一种语音处理方法,一种语音处理装置、一种语音处理设备及一种计算机可读存储介质。
技术介绍
语音信号经VoIP系统传输的过程中可能会产生音质损伤的现象。现有技术中,解决音质损伤的现象的一种主流方案是经典的PLC技术,主要原理是:接收端如果未收到第n(n为正整数)帧语音帧,会对第n-1帧语音帧进行信号分析处理以补偿第n帧语音帧。但实践发现,由于信号分析处理能力有限,经典的PLC技术的语音处理能力有限,无法适用于现网突发丢包的场景。
技术实现思路
本申请实施例提供一种语音处理方法、装置、设备及存储介质,能够弥补传统信号分析处理技术的不足,提升语音处理能力。一方面,本申请实施例提供一种语音处理方法,包括:确定待处理的目标语音帧对应的历史语音帧;获取历史语音帧的频域特征和历史语音帧的时域参数;根据历史语音帧的频域 ...
【技术保护点】
1.一种语音处理方法,其特征在于,包括:/n确定待处理的目标语音帧对应的历史语音帧;/n获取所述历史语音帧的频域特征和所述历史语音帧的时域参数;/n根据所述历史语音帧的频域特征与所述历史语音帧的时域参数之间的相关性,预测所述目标语音帧的参数集,所述参数集中包含至少两个参数;/n根据所述参数集重建所述目标语音帧。/n
【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:
确定待处理的目标语音帧对应的历史语音帧;
获取所述历史语音帧的频域特征和所述历史语音帧的时域参数;
根据所述历史语音帧的频域特征与所述历史语音帧的时域参数之间的相关性,预测所述目标语音帧的参数集,所述参数集中包含至少两个参数;
根据所述参数集重建所述目标语音帧。
2.如权利要求1所述的方法,其特征在于,所述根据所述参数集重建所述目标语音帧,包括:
根据所述参数集建立重建滤波器;
获取目标语音帧的激励信号;
采用所述重建滤波器对所述目标语音帧的激励信号进行滤波处理,得到所述目标语音帧。
3.如权利要求2所述的方法,其特征在于,所述获取目标语音帧的激励信号,包括:
获取所述历史语音帧的激励信号;
根据所述历史语音帧的激励信号估计所述目标语音帧的激励信号。
4.如权利要求3所述的方法,其特征在于,所述目标语音帧是指经VoIP系统传输的语音信号中的第n帧语音帧;
所述历史语音帧包括经所述VoIP系统传输的语音信号中的第n-t帧至第n-1帧共t帧语音帧,n、t均为正整数。
5.如权利要求4所述的方法,其特征在于,所述历史语音帧的激励信号包括第n-1帧语音帧的激励信号;所述根据所述历史语音帧的激励信号估计所述目标语音帧的激励信号,包括:
将所述第n-1帧语音帧的激励信号确定为所述目标语音帧的激励信号。
6.如权利要求4所述的方法,其特征在于,所述历史语音帧的激励信号包括第n-t帧至第n-1帧中各帧语音帧的激励信号;所述根据所述历史语音帧的激励信号估计所述目标语音帧的激励信号,包括:
对所述第n-t帧至第n-1帧共t帧语音帧的激励信号进行平均值计算,得到所述目标语音帧的激励信号。
7.如权利要求4所述的方法,其特征在于,所述历史语音帧的激励信号包括第n-t帧至第n-1帧中各帧语音帧的激励信号;所述根据所述历史语音帧的激励信号估计所述目标语音帧的激励信号,包括:
对所述第n-t帧至第n-1帧共t帧语音帧的激励信号进行加权求和,得到所述目标语音帧的激励信号。
8.如权利要求1所述的方法,其特征在于,所述根据所述历史语音帧的频域特征与所述历史语音帧的时域参数之间的相关性,预测所述目标语音帧的参数集,包括:
调用网络模型对所述历史语音帧的频域特征和所述历史语音帧的时域参数进行预测处理,得到所述目标语音帧的参数集;所述参数集中包含至少两个参数,所述网络模型包含多个神经网络,所述神经网络的数量根据所述参数集中的参数数量确定。
9.如权利要求8所述的方法,其特征在于,所述网络模型包括第一神经网络及至少两个第二神经网络,所述第二神经网络属于所述第一神经网络的子网络;一个所述第二神经网络与所述参数集中的一种参数相对应;
所述调用网络模型对所述历史语音帧的频域特征和所述历史语音帧的时域参数进行预测处理,得到所述目标语音帧的参数集,包括:
调用所述第一神经网络对所述历史语音帧的频域特征进行预测处理,得到所述目标语音帧的虚拟频域特征;
将所述目标语音帧的虚拟频域特征和所述历史语音帧的时域参数作为输入信息分别输入至所述至少两个第二神经网络中进行预测处理,得到所述目标语音帧的参数集中的至少两个参数。
10.如权利要求1所述的方法,其特征在于,所述获取所述历史语音帧的频域特征,包括:
对所述历史语音帧进行短时傅里叶变换处理,得到所述历史语音帧对应的频域系数;
从所述历史语音帧对应的频域系数中提取幅度谱作为所述历史语音帧的频...
【专利技术属性】
技术研发人员:肖玮,王蒙,朱凌,王文龙,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。