【技术实现步骤摘要】
语音编码控制方法、装置及存储介质
本专利技术涉及语音通信
,尤其涉及一种语音编码控制方法、装置及存储介质。
技术介绍
多人通话是指参与通话的多方通过不同的设备(终端)进行音频信号采集及各种音频处理,然后经过语音编码及网络传输打包,经过网络发送到音频混音设备,混音设备将语音编码数据解码后做声音的混合叠加处理,最后各与会方的终端根据相应的混音结果信号进行声音播放。由于人耳对同一时间来自不同声源的混合信号的有效辨识能力比较有限,通常情况下人耳只能识别4人以下的同时说话声,当同一时刻说话人达到或超过4人,则混音后的声音人耳难以辨别,感觉声音杂乱而听不清楚。为了解决这个问题,多人通话的混音算法或者选路混音算法会对来自不同与会方的声音信号做加权处理或选路筛选处理,其结果将突出有限的几路声音,避免一些非主要的或者干扰的声音信号混入进而影响人耳收听效果。例如选路方案中,50人通话,其中有10人有发声,如果预设最大选路方数为3,则每一时刻只有3方的声音最终被选中,其余未被选中的通话数据将不被转发到接收客户端。多人通话的语 ...
【技术保护点】
1.一种语音编码控制方法,其特征在于,包括:/n接收参与多人通话的各通话终端发送的通话音频,所述通话音频是通话终端基于当前的编码参数对采集的声音信号进行语音编码得到的;/n对接收到的所述通话音频进行混音处理,得到混音结果;/n确定各所述通话终端在所述混音结果中的听感贡献度,所述听感贡献度用于反映与所述通话终端对应的成员参与通话的活跃程度;/n根据所述听感贡献度确定各所述通话终端的目标编码参数;/n将所述目标编码参数返回至对应的通话终端,以便基于所述目标编码参数调整各通话终端当前的编码参数。/n
【技术特征摘要】
1.一种语音编码控制方法,其特征在于,包括:
接收参与多人通话的各通话终端发送的通话音频,所述通话音频是通话终端基于当前的编码参数对采集的声音信号进行语音编码得到的;
对接收到的所述通话音频进行混音处理,得到混音结果;
确定各所述通话终端在所述混音结果中的听感贡献度,所述听感贡献度用于反映与所述通话终端对应的成员参与通话的活跃程度;
根据所述听感贡献度确定各所述通话终端的目标编码参数;
将所述目标编码参数返回至对应的通话终端,以便基于所述目标编码参数调整各通话终端当前的编码参数。
2.根据权利要求1所述的方法,其特征在于,所述对接收到的通话音频进行混音处理,得到混音结果包括:
对接收到的通话音频进行语音解码,得到与各所述通话终端对应的声音信号;
针对每个通话终端,根据预设的混音算法对除自身之外的其他终端对应的声音信号进行混音处理,得到与各通话终端对应的混合音频。
3.根据权利要求2所述的方法,其特征在于,所述确定各所述通话终端在所述混音结果中的听感贡献度,包括:
计算所有通话终端对应的混合音频的累计平滑值;
确定每个通话终端在各混合音频中的混音贡献,所述混音贡献是根据通话终端提供的通话音频的混音权重和混合音频确定的;
根据通话终端在各混合音频中的混音贡献,确定每个通话终端在所有混合音频中的贡献累计平滑值;
确定各通话终端的贡献累计平滑值在所述累计平滑值中的贡献比例,将所述贡献比例作为所述通话终端在所述混音结果中的听感贡献度。
4.根据权利要求1所述的方法,其特征在于,
所述根据所述听感贡献度确定各所述通话终端的目标编码参数,包括:
获取各通话终端当前的编码参数;
根据各通话终端对应的听感贡献度和当前的编码参数,按照预设的计算模型,计算得到各通话终端的目标编码参数;
所述将所述目标编码参数返回至对应的通话终端,以便基于所述目标编码参数调整各通话终端当前的编码参数,包括:
将所述目标编码参数返回至对应的通话终端,以便各通话终端将当前的编码参数更新为接收到的目标编码参数,基于所述目标编码参数对采集的声音信号进行语音编码。
5.根据权利要求2所述的方法,其特征在于,所述针对每个通话终端,根据预设的混音算法对除自身之外的其他终端对应的声音信号进行混音处理,得到与各通话终端对应的混合音频,包括:
...
【专利技术属性】
技术研发人员:梁俊斌,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。