语音传输方法、系统、装置、计算机可读存储介质和设备制造方法及图纸

技术编号：24582811 阅读：29 留言：0更新日期：2020-06-21 01:21

本申请涉及一种语音传输方法、系统、装置、计算机可读存储介质和设备，所述方法包括：获取语音编码码流中的当前编码数据；通过基于机器学习的丢包恢复能力预测模型，根据当前编码数据对应的第一语音编码特征参数以及当前编码数据的在前编码数据对应的第二语音编码特征参数，获得当前编码数据对应的丢包恢复能力；根据丢包恢复能力判决是否需要进行冗余多发处理，若是，则对当前编码数据进行冗余多发处理后再传输至接收端；若否，则直接将当前编码数据传输至接收端。本申请提供的方案可以有效提升网络带宽的利用率，同时也能保证传输网络的抗丢包能力。

Voice transmission methods, systems, devices, computer-readable storage media and devices

全部详细技术资料下载

【技术实现步骤摘要】
语音传输方法、系统、装置、计算机可读存储介质和设备
本申请涉及计算机
，特别是涉及一种语音传输方法、系统、装置、计算机可读存储介质和计算机设备。
技术介绍
互联网是非可靠的传输网络，基于互联网的语音传输面对的主要问题就是抗丢包问题，由于传输网络的不稳定性，传输过程会出现丢包现象。为了抵抗网络丢包，通常会采用冗余多发机制将数据包发送到接收端，目的是增加接收端接收到数据包的概率，从而起到抗丢包的效果。然而，冗余多发机制势必带来带宽成倍数的增大，消耗过多网络带宽资源，尤其对于带宽受限场景下容易出现网络拥塞等问题反而会导致丢包更多。
技术实现思路
基于此，有必要针对现有技术中对数据包进行冗余多发处理带来的网络带宽资源消耗、网络拥塞而导致丢包更多的技术问题，提供一种语音传输方法、装置、系统、计算机可读存储介质和计算机设备。一种语音传输方法，包括：获取语音编码码流中的当前编码数据；通过基于机器学习的丢包恢复能力预测模型，根据当前编码数据对应的第一语音编码特征参数以及所述当前编码数...

【技术保护点】
1.一种语音传输方法，包括：/n获取语音编码码流中的当前编码数据；/n通过基于机器学习的丢包恢复能力预测模型，根据当前编码数据对应的第一语音编码特征参数以及所述当前编码数据的在前编码数据对应的第二语音编码特征参数，获得所述当前编码数据对应的丢包恢复能力；/n根据所述丢包恢复能力判决是否需要进行冗余多发处理；/n若是，则对所述当前编码数据进行冗余多发处理后再传输至接收端；/n若否，则直接将所述当前编码数据传输至接收端。/n

【技术特征摘要】
1.一种语音传输方法，包括：
获取语音编码码流中的当前编码数据；
通过基于机器学习的丢包恢复能力预测模型，根据当前编码数据对应的第一语音编码特征参数以及所述当前编码数据的在前编码数据对应的第二语音编码特征参数，获得所述当前编码数据对应的丢包恢复能力；
根据所述丢包恢复能力判决是否需要进行冗余多发处理；
若是，则对所述当前编码数据进行冗余多发处理后再传输至接收端；
若否，则直接将所述当前编码数据传输至接收端。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取原始语音信号；
将原始语音信号进行分割，获得原始语音序列；
依次对所述原始语音序列中的语音片段进行语音编码，获得语音编码码流。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取原始语音序列中的语音片段各自对应的语音编码特征参数；
根据所述语音编码特征参数对相应的语音片段进行语音编码，生成对应的编码数据后获得语音编码码流；
缓存语音编码过程中各个编码数据所采用的语音编码特征参数。

4.根据权利要求1所述的方法，其特征在于，所述通过基于机器学习的丢包恢复能力预测模型，根据当前编码数据对应的第一语音编码特征参数以及所述当前编码数据的在前编码数据对应的第二语音编码特征参数，获得所述当前编码数据对应的丢包恢复能力，包括：
将所述当前编码数据对应的第一语音编码特征参数以及所述当前编码数据的在前编码数据对应的第二语音编码特征参数输入至丢包恢复能力预测模型；
通过所述丢包恢复能力预测模型，根据所述第一语音编码特征参数及所述第二语音编码特征参数，输出对所述当前编码数据进行直接解码所确定的第一语音质量评分与对所述当前编码数据进行丢包恢复处理后解码所确定的第二语音质量评分之间的评分差异；
根据所述评分差异确定所述当前编码数据对应的丢包恢复能力；
其中，所述当前编码数据对应的丢包恢复能力与所述评分差异成反相关。

5.根据权利要求1所述的方法，其特征在于，所述对所述当前编码数据进行冗余多发处理后再传输至接收端，包括：
获取接收端所反馈的丢包状态信息；
根据所述丢包状态信息确定所述当前编码数据所对应的冗余多发参数；
按照所述冗余多发参数复制所述当前编码数据后传输至所述接收端。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：
当所述接收端接收到所述当前编码数据或所述当前编码数据对应的冗余多发包时，则通过所述接收端过滤掉重复的数据包后进行解码，获得所述当前编码数据对应的语音信号。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：
当所述接收端未接收到所述当前编码数据及所述当前编码数据对应的冗余多发包时，则通过所述接收端对所述当前编码数据进行丢包恢复处理，获得对应于所述当前编码数据的恢复包，对所述恢复包进行解码，获得所述当前编码数据对应的语音信号。

8.根据权利要求1至7任一项所述的方法，其特征在于，所述丢包恢复能力预测模型通过以下步骤确定：
获取训练集中的样本语音序列；
对所述样本语音序列进行语音编码，获得样本语音编码码流；
提取所述样本语音编码码流中的当前编码数据所采用的第一语音编码特征参数以及所述当前编码数据的在前编码数据所采用的第二语音编码特征参数；
获取直接对所述样本语音编码码流进行解码并获得第一语音信号后，基于所述第一语音信号所确定的第一语音质量评分；
获取对所述当前编码数据进行模拟丢包恢复处理获得恢复包，对所述恢复包进行解码并获得第二语音信号后，基于所述第二语音信号所确定的第二语音质量评分；
...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人