一种控制通话带宽的方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37873806 阅读：12 留言：0更新日期：2023-06-15 21:02

本申请公开了一种控制通话带宽的方法、装置、电子设备和存储介质，涉及通信技术领域。该方法为：获取多个通话对象之间进行语音通话时，产生的当前帧的音频总数据。然后，基于各个通话对象在进行语音通话时的发言活跃度，分别确定所述音频总数据中，各个通话对象对应的音频子数据各自的关键级别；每个关键级别用于表征：相应的音频子数据在所述音频总数据中的内容重要程度。进一步地，可以基于获得的各个关键级别，分别确定在所述当前帧之后的预设时长内，各个通话对象对应的编码参数。基于该方法可以灵活调节多个对象之间进行语音交流中音频数据所占用的带宽，从而提升各个对象使用即时通讯软件进行语音通话的体验。时通讯软件进行语音通话的体验。时通讯软件进行语音通话的体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种控制通话带宽的方法、装置、电子设备和存储介质

[0001]本申请涉及通信
，尤其涉及一种控制通话带宽的方法、装置、电子设备和存储介质。

技术介绍

[0002]随着科学技术的快速发展，各类应用程序为生活和生产带来了极大的便利，例如，各个对象之间可以基于即时通讯软件进行语音交流。
[0003]相关技术下，在多个对象之间进行语音交流的过程中，即时通讯软件对应的服务器会给各个对象使用的智能终端配置相同的编码参数，这样，各个智能终端可以采用获得的编码参数，对自身采集的原始音频信号进行编码，并将编码后的目标音频信号发往对端。
[0004]然而，由于各个对象使用的智能终端被配置相同的编码参数，因此传输各个对象对应的音频数据时所占用的带宽相同。这样，当多个对象中的主发言对象对应的音频数据被配置的传输带宽，与该音频数据在实际传输时所需求的带宽相比较小时，可能导致其他对象接收到该音频数据的质量较差，从而无法获取准确的信息。以及，当多个对象中的倾听对象对应的音频数据被配置的传输带宽，与该音频数据在实际传输时所需求的带宽相比较大时，可能导致带宽资源的浪费，从而增加了对象的语音通话成本。
[0005]可见，相关技术下，存在多个对象之间进行语音交流时，各个音频数据传输时所占用的带宽与实际使用需求不匹配，导致各个对象使用即时通讯软件进行的语音通话的体验较差的问题。

技术实现思路

[0006]本申请实施例中提供了一种控制通话带宽的方法、装置、电子设备和存储介质，用于调节多个对象之间进行语音交流中音频...

【技术保护点】

【技术特征摘要】
1.一种控制通话带宽的方法，其特征在于，所述方法包括：获取多个通话对象之间进行语音通话时，产生的当前帧的音频总数据；基于各个通话对象在进行语音通话时的发言活跃度，分别确定所述音频总数据中，各个通话对象对应的音频子数据各自的关键级别；每个关键级别用于表征：相应的音频子数据在所述音频总数据中的内容重要程度；每个发言活跃度是基于相应的通话对象，在当前帧和历史帧各自的发言状态确定的；基于获得的各个关键级别，分别确定在所述当前帧之后的预设时长内，各个通话对象对应的编码参数。2.如权利要求1所述的方法，其特征在于，在获取多个通话对象之间进行语音通话时，产生的当前帧的音频总数据之后，所述方法还包括：对所述音频总数据进行语音活跃检测，获得检测结果；当基于所述检测结果，确定所述音频总数据中存在语音信号时，对所述音频总数据进行能量平滑值计算处理，获得所述各个音频子数据各自对应的能量平滑值；基于获得的各个能量平滑值，分别确定相应的通话对象对应的发言状态。3.如权利要求2所述的方法，其特征在于，对所述音频总数据进行能量平滑值计算处理，获得所述各个音频子数据各自对应的能量平滑值，包括：确定所述各个音频子数据各自对应的历史能量平滑值，并基于所述各个音频子数据各自对应的历史能量平滑值与第一平滑系数，确定所述各个音频子数据各自对应的当前帧的第一能量平滑值；确定各个通话对象在所述音频总数据中的语音信号的样点值，并基于各个所述样点值和所述第一平滑系数，确定所述各个音频子数据各自对应的当前帧的第二能量平滑值；基于各个第一能量平滑值和相应的第二能量平滑值，获得所述各个音频子数据各自对应的能量平滑值。4.如权利要求2所述的方法，其特征在于，基于各个通话对象在进行语音通话时的发言活跃度，分别确定所述音频总数据中，各个通话对象对应的音频子数据各自的关键级别，包括：基于在所述音频总数据中各个通话对象对应的发言状态和历史发言活跃度，确定各个通话对象在所述当前帧的发言活跃度；基于各个通话对象各自对应的发言活跃度和发言状态，分别确定所述各个通话对象对应的各个音频子数据各自的关键级别。5.如权利要求4所述的方法，其特征在于，基于在所述当前帧各个通话对象对应的发言状态和历史发言活跃度，确定各个通话对象在所述当前帧的发言活跃度，包括：确定所述各个通话对象各自对应的历史发言活跃度，并基于各个通话对象各自对应的历史发言活跃度与第二平滑系数，确定各个通话对象各自对应的当前帧的第一发言活跃度；基于各个通话对象在所述当前帧对应的发言状态和所述第二平滑系数，获得各个通话对象各自对应的当前帧的第二发言活跃度；基于各个第一发言活跃度和相应的第二发言活跃度，获得各个通话对象各自对应的发言活跃度。
6.如权利要求4所述的方法，其特征在于，基于各个通话对象各自对应的发言活跃度和发言状态，分别确定所述各个通话对象对应的各个音频子数据各自的关键级别，包括：对各个通话对象，分别执行以下步骤：当确定所述通话对象对应的发言状态为未发言，且相应的发言活跃度不小于预设阈值时，确定所述通话对象对应的音频子数据的关键级别为次低级别；当确定所述通话对象对应的发言状态为未发言，且相应的发言活跃度小于所述预设阈值时，确定所述通话对象对应的音频子数据的关键级别为最低级别；当确定所述通话对象对应的发言状态为发言，且相应的发言活跃度不小于所述预设阈值时，确定所述通话对象对应的音频子数据的关键级别为最高级别；当确定所述通话对象对应的发言状态为发言，且相应的发言活跃度小于所述预设阈值时，确定所述通话对象对应的音频子数据的关键级别为次高级别。7.如权利要求1所述的方法，其特征在于，基于获得的各个关键级别，分...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人