【技术实现步骤摘要】
语音数据处理方法、装置、设备及存储介质
[0001]本申请涉及人工智能中的机器学习领域,尤其涉及一种语音数据处理方法、装置、设备及存储介质。
技术介绍
[0002]随着互联网技术发展,互联网可实现快速地、高效地语音数据传输,给用户的工作以及生活带来极大便利。但是,受互联网中传输的语音数据增多以及网络质量变差等因素的影响,容易导致语音数据出现异常。例如,在音视频通话、网络直播业务中,如果传输语音数据的网络的信号质量不稳定,容易出现丢包现象,造成接收端所接收到的语音数据出现卡顿和不连贯等问题,使收听者体验不佳。
[0003]目前通常采用FEC(forward error correction前向纠错)的编码方法来抵抗语音数据的丢包等问题,该编码方法相当于根据冗余参数在网络中增加冗余数据,接收端根据冗余数据对原始语音数据中的异常数据进行修复处理。该冗余参数具体可以是指冗余率,冗余率是根据冗余数据中的数据帧数与原始语音数据中数据帧数之间的比值确定的。实践中发现,冗余率过大,需要消耗目标网络更多带宽资源,容易造成目标网络出现拥塞,导致后续传输的原始数据中出现更多异常数据;冗余率过小,对原始语音数据中的异常数据恢复处理结果较差。由此可知,冗余参数是决定该编码方法优劣的关键因素,目前主要依靠专业人员基于固化的规则来配置冗余参数,但是,配置出的冗余参数无法适应复杂多变的网络,导致语音数据的质量不佳。
技术实现思路
[0004]本申请实施例所要解决的技术问题在于,提供一种语音数据处理方法、装置、设备及存储介质, ...
【技术保护点】
【技术特征摘要】
1.一种语音数据处理方法,其特征在于,包括:获取与第一网络状态关联的第一目标冗余参数,以及所述第一目标冗余参数的长期奖励值;所述第一目标冗余参数的长期奖励值用于反映所述第一目标冗余参数与所述第一网络状态之间的匹配度,所述第一网络状态是接收设备对目标网络中传输的第一语音数据包进行解析得到的;根据所述第一目标冗余参数对待传输的第一原始语音数据进行冗余编码,得到第二语音数据包,通过所述目标网络将所述第二语音数据包发送至所述接收设备;获取所述接收设备对所述第二语音数据包进行解析得到的所述目标网络的第二网络状态,以及对所述第二语音数据包中的异常数据进行恢复处理所生成的恢复状态信息;根据所述第二网络状态、所述恢复状态信息对所述第一目标冗余参数的长期奖励值进行更新,得到更新后的长期奖励值;所述更新后的长期奖励值用于在所述目标网络处于所述第一网络状态时,获取与所述第一网络状态关联的冗余参数。2.如权利要求1所述的方法,其特征在于,所述根据所述第一目标冗余参数对待传输的第一原始语音数据进行冗余编码,得到第二语音数据包,包括:对所述第一原始语音数据进行编码,得到编码数据;根据所述第一目标冗余参数以及所述编码数据,生成冗余数据;所述冗余数据用于对所述第一原始语音数据中的异常数据进行恢复处理;对所述冗余数据和所述编码数据进行组合,得到第二语音数据包。3.如权利要求2所述的方法,其特征在于,所述根据所述第二网络状态、所述恢复状态信息对所述第一目标冗余参数的长期奖励值进行更新,得到更新后的长期奖励值,包括:获取与所述第二网络状态关联的第二目标冗余参数,以及所述第二目标冗余参数的长期奖励值;根据所述恢复状态信息确定所述第一目标冗余参数的瞬时奖励值;根据所述第二目标冗余参数的长期奖励值、所述第一目标冗余参数的瞬时奖励值,对所述第一目标冗余参数的长期奖励值进行更新,得到更新后的长期奖励值。4.如权利要求3所述的方法,其特征在于,所述第一原始语音数据包括至少两帧数据;所述恢复状态信息包括所述第一原始语音数据中的异常数据对应的异常数据帧数,以及采用所述冗余数据对所述异常数据进行恢复处理所恢复出的数据中的恢复数据帧数;所述根据所述恢复状态信息确定所述第一目标冗余参数的瞬时奖励值,包括:根据所述恢复数据帧数以及所述异常数据帧数确定所述第一原始语音数据的恢复率;根据所述第一原始语音数据的恢复率、以及所述第一目标冗余参数生成所述第一目标冗余参数的瞬时奖励值。5.如权利要求3所述的方法,其特征在于,所述根据所述第二目标冗余参数的长期奖励值、所述第一目标冗余参数的瞬时奖励值,对所述第一目标冗余参数的长期奖励值进行更新,得到更新后的长期奖励值,包括:统计所述第二目标冗余参数的长期奖励值与所述第一目标冗余参数的长期奖励值之间的长期奖励值差距;统计所述长期奖励值差距与所述第一目标冗余参数的瞬时奖励值之间的奖励值和;获取学习权重,采用所述学习权重对所述奖励值和进行加权,得到加权后的奖励值;
将加权后的奖励值和所述第一目标冗余参数的长期奖励值之间的和,作为更新后的长期奖励值。6.如权利要求3所述的方法,其特征在于,所述第二网络状态包括丢失数据帧数以及传输时延;所述获取与所述第二网络状态关联的第二目标冗余参数,以及所述第二目标冗余参数的长期奖励值,包括:根据所述第二网络状态包括的丢失数据帧数以及传输时延,生成所述第二网络状态对应的状态值;获取冗余参数列表,所述冗余参数列表用于反映冗余参数、长期奖励值以及状态值之间的映射关系;从所述冗余参数列表中查询与所述第二网络状态对应的状态值具有映射关系的第二目标冗余参数,以及所述第二目标冗余参数的长期奖励值。7.如权利要求6所述的方法,其特征在于,所述从所述冗余参数列表中查询与所述第二网络状态对应的状态值具有映射关系的第二目标冗余参数,以及所述第二目标冗余参数的长期奖励值,包括:从所述冗余参数列表中查询与所述第二网络状态对应的状态值具有映射关系的候选冗余参数,以及所述候选冗余参数的长期奖励值;统计历史时间段内连续地从所述冗余参数列表获取目标历史冗余参数的获取次数;所述目标历史冗余参数为与历史状态值具有映射关系的历史候选冗余参数中,具有最大长期奖励值的历史候选冗余参数;根据所述获取次数,从所述...
【专利技术属性】
技术研发人员:梁俊斌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。