一种控制通话带宽的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37873806 阅读:12 留言:0更新日期:2023-06-15 21:02
本申请公开了一种控制通话带宽的方法、装置、电子设备和存储介质,涉及通信技术领域。该方法为:获取多个通话对象之间进行语音通话时,产生的当前帧的音频总数据。然后,基于各个通话对象在进行语音通话时的发言活跃度,分别确定所述音频总数据中,各个通话对象对应的音频子数据各自的关键级别;每个关键级别用于表征:相应的音频子数据在所述音频总数据中的内容重要程度。进一步地,可以基于获得的各个关键级别,分别确定在所述当前帧之后的预设时长内,各个通话对象对应的编码参数。基于该方法可以灵活调节多个对象之间进行语音交流中音频数据所占用的带宽,从而提升各个对象使用即时通讯软件进行语音通话的体验。时通讯软件进行语音通话的体验。时通讯软件进行语音通话的体验。

【技术实现步骤摘要】
一种控制通话带宽的方法、装置、电子设备和存储介质


[0001]本申请涉及通信
,尤其涉及一种控制通话带宽的方法、装置、电子设备和存储介质。

技术介绍

[0002]随着科学技术的快速发展,各类应用程序为生活和生产带来了极大的便利,例如,各个对象之间可以基于即时通讯软件进行语音交流。
[0003]相关技术下,在多个对象之间进行语音交流的过程中,即时通讯软件对应的服务器会给各个对象使用的智能终端配置相同的编码参数,这样,各个智能终端可以采用获得的编码参数,对自身采集的原始音频信号进行编码,并将编码后的目标音频信号发往对端。
[0004]然而,由于各个对象使用的智能终端被配置相同的编码参数,因此传输各个对象对应的音频数据时所占用的带宽相同。这样,当多个对象中的主发言对象对应的音频数据被配置的传输带宽,与该音频数据在实际传输时所需求的带宽相比较小时,可能导致其他对象接收到该音频数据的质量较差,从而无法获取准确的信息。以及,当多个对象中的倾听对象对应的音频数据被配置的传输带宽,与该音频数据在实际传输时所需求的带宽相比较大时,可能导致带宽资源的浪费,从而增加了对象的语音通话成本。
[0005]可见,相关技术下,存在多个对象之间进行语音交流时,各个音频数据传输时所占用的带宽与实际使用需求不匹配,导致各个对象使用即时通讯软件进行的语音通话的体验较差的问题。

技术实现思路

[0006]本申请实施例中提供了一种控制通话带宽的方法、装置、电子设备和存储介质,用于调节多个对象之间进行语音交流中音频数据所占用的带宽,提升各个对象使用即时通讯软件进行语音通话的体验。
[0007]一方面,提供一种控制通话带宽的方法,所述方法包括:
[0008]获取多个通话对象之间进行语音通话时,产生的当前帧的音频总数据;
[0009]基于各个通话对象在进行语音通话时的发言活跃度,分别确定所述音频总数据中,各个通话对象对应的音频子数据各自的关键级别;每个关键级别用于表征:相应的音频子数据在所述音频总数据中的内容重要程度;每个发言活跃度是基于相应的通话对象,在当前帧和历史帧各自的发言状态确定的;
[0010]基于获得的各个关键级别,分别确定在所述当前帧之后的预设时长内,各个通话对象对应的编码参数。
[0011]一方面,提供一种控制通话带宽的装置,所述装置包括:
[0012]获取单元,用于获取多个通话对象之间进行语音通话时,产生的当前帧的音频总数据;
[0013]第一确定单元,用于基于各个通话对象在进行语音通话时的发言活跃度,分别确
定所述音频总数据中,各个通话对象对应的音频子数据各自的关键级别;每个关键级别用于表征:相应的音频子数据在所述音频总数据中的内容重要程度;每个发言活跃度是基于相应的通话对象,在当前帧和历史帧各自的发言状态确定的;
[0014]第二确定单元,用于基于获得的各个关键级别,分别确定在所述当前帧之后的预设时长内,各个通话对象对应的编码参数。
[0015]可选的,所述第一确定单元,具体用于:
[0016]对各个通话对象,分别执行以下步骤:
[0017]当确定所述通话对象对应的发言状态为未发言,且相应的发言活跃度不小于预设阈值时,确定所述通话对象对应的音频子数据的关键级别为次低级别;
[0018]当确定所述通话对象对应的发言状态为未发言,且相应的发言活跃度小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为最低级别;
[0019]当确定所述通话对象对应的发言状态为发言,且相应的发言活跃度不小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为最高级别;
[0020]当确定所述通话对象对应的发言状态为发言,且相应的发言活跃度小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为次高级别。
[0021]可选的,所述第二确定单元,具体用于:
[0022]确定各个关键级别与采样率和编码码率的映射关系;
[0023]基于所述映射关系和所述各个关键级别,分别确定在所述当前帧之后的预设时长内,各个通话对象对应的编码参数。
[0024]可选的,所述装置还包括第二处理单元,用于:
[0025]确定当前时刻是否达到所述预设时长的结束时刻;
[0026]当确定当前时刻达到所述预设时长内的结束时刻时,则重新采集所述多个通话对象之间进行语音通话时,产生的新音频帧的音频总数据;
[0027]确定在所述新音频帧的音频总数据的采集时刻之后的所述预设时长内,各个通话对象对应的新的编码参数,直至所述多个通话对象之间结束语音通话。
[0028]一方面,提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述控制通话带宽的方法。
[0029]一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述控制通话带宽的方法。
[0030]一方面,提供一种计算机可读存储介质,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行上述任意一种控制通话带宽的方法的步骤。
[0031]本申请有益效果如下:
[0032]本申请实施例提供的控制通话带宽的方法、装置、电子设备和存储介质,由于基于各个通话对象在进行语音通话时的发言活跃度,分别确定音频总数据中,各个通话对象对应的音频子数据各自的关键级别,并基于获得的各个关键级别,分别确定在当前帧之后的
预设时长内,各个通话对象对应的编码参数。因此,电子设备可以对多个通话对象之间进行语音通话时,产生的当前帧的音频总数据中各个通话对象对应的编码参数进行灵活调节确定。这样,电子设备可以灵活调节多个对象之间进行语音交流中音频数据所占用的带宽,从而提升各个对象使用即时通讯软件进行语音通话的体验。
[0033]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0034]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0035]图1为本申请实施例中的一种应用场景的一个可选的示意图;
[0036]图2为本申请实施例中的一种应用场景的另一个可选的示意图;
[0037]图3为本申请实施例中的一种应用场景的又一个可选的示意图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种控制通话带宽的方法,其特征在于,所述方法包括:获取多个通话对象之间进行语音通话时,产生的当前帧的音频总数据;基于各个通话对象在进行语音通话时的发言活跃度,分别确定所述音频总数据中,各个通话对象对应的音频子数据各自的关键级别;每个关键级别用于表征:相应的音频子数据在所述音频总数据中的内容重要程度;每个发言活跃度是基于相应的通话对象,在当前帧和历史帧各自的发言状态确定的;基于获得的各个关键级别,分别确定在所述当前帧之后的预设时长内,各个通话对象对应的编码参数。2.如权利要求1所述的方法,其特征在于,在获取多个通话对象之间进行语音通话时,产生的当前帧的音频总数据之后,所述方法还包括:对所述音频总数据进行语音活跃检测,获得检测结果;当基于所述检测结果,确定所述音频总数据中存在语音信号时,对所述音频总数据进行能量平滑值计算处理,获得所述各个音频子数据各自对应的能量平滑值;基于获得的各个能量平滑值,分别确定相应的通话对象对应的发言状态。3.如权利要求2所述的方法,其特征在于,对所述音频总数据进行能量平滑值计算处理,获得所述各个音频子数据各自对应的能量平滑值,包括:确定所述各个音频子数据各自对应的历史能量平滑值,并基于所述各个音频子数据各自对应的历史能量平滑值与第一平滑系数,确定所述各个音频子数据各自对应的当前帧的第一能量平滑值;确定各个通话对象在所述音频总数据中的语音信号的样点值,并基于各个所述样点值和所述第一平滑系数,确定所述各个音频子数据各自对应的当前帧的第二能量平滑值;基于各个第一能量平滑值和相应的第二能量平滑值,获得所述各个音频子数据各自对应的能量平滑值。4.如权利要求2所述的方法,其特征在于,基于各个通话对象在进行语音通话时的发言活跃度,分别确定所述音频总数据中,各个通话对象对应的音频子数据各自的关键级别,包括:基于在所述音频总数据中各个通话对象对应的发言状态和历史发言活跃度,确定各个通话对象在所述当前帧的发言活跃度;基于各个通话对象各自对应的发言活跃度和发言状态,分别确定所述各个通话对象对应的各个音频子数据各自的关键级别。5.如权利要求4所述的方法,其特征在于,基于在所述当前帧各个通话对象对应的发言状态和历史发言活跃度,确定各个通话对象在所述当前帧的发言活跃度,包括:确定所述各个通话对象各自对应的历史发言活跃度,并基于各个通话对象各自对应的历史发言活跃度与第二平滑系数,确定各个通话对象各自对应的当前帧的第一发言活跃度;基于各个通话对象在所述当前帧对应的发言状态和所述第二平滑系数,获得各个通话对象各自对应的当前帧的第二发言活跃度;基于各个第一发言活跃度和相应的第二发言活跃度,获得各个通话对象各自对应的发言活跃度。
6.如权利要求4所述的方法,其特征在于,基于各个通话对象各自对应的发言活跃度和发言状态,分别确定所述各个通话对象对应的各个音频子数据各自的关键级别,包括:对各个通话对象,分别执行以下步骤:当确定所述通话对象对应的发言状态为未发言,且相应的发言活跃度不小于预设阈值时,确定所述通话对象对应的音频子数据的关键级别为次低级别;当确定所述通话对象对应的发言状态为未发言,且相应的发言活跃度小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为最低级别;当确定所述通话对象对应的发言状态为发言,且相应的发言活跃度不小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为最高级别;当确定所述通话对象对应的发言状态为发言,且相应的发言活跃度小于所述预设阈值时,确定所述通话对象对应的音频子数据的关键级别为次高级别。7.如权利要求1所述的方法,其特征在于,基于获得的各个关键级别,分...

【专利技术属性】
技术研发人员:梁俊斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1