音频编码方法、装置、设备和介质制造方法及图纸

技术编号:36189348 阅读:14 留言:0更新日期:2022-12-31 21:01
本公开提供一种音频编码方法、装置、设备和介质,涉及计算机术领域,音频编码方法包括:确定当前观看直播的用户数量;若用户数量大于或者等于第一用户数量阈值,且小于第二用户数量阈值,则确定直播终端的设备负载;若设备负载大于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与第一音频类型对应的第一目标编码码率,并利用第一目标编码码率对直播音频进行编码。在音频编码过程中,可以在提升音频编码质量的同时,减少带宽资源的浪费。资源的浪费。资源的浪费。

【技术实现步骤摘要】
音频编码方法、装置、设备和介质


[0001]本公开涉及计算机
,尤其涉及一种音频编码方法、音频编码装置、电子设备和计算机可读存储介质。

技术介绍

[0002]伴随着互联网技术的成熟,网络直播成为一种常见的传媒手段,在直播场景下,用户可以通过用户终端实时观看当前正在发生的事件。通常情况下,网络直播过程中的音频可以包括:音乐音频,语音音频以及背景噪声三类音频。
[0003]相关技术中,通常可以选用不同的码率对不同类型的音频数据进行编码,但是,仅根据音频类型确定编码码率,对音频数据编码,依旧会出现带宽资源浪费,或者,带宽资源分配不足导致的直播卡顿、延时等情况,影响用户的直播观看体验。

技术实现思路

[0004]本公开提供一种音频编码方法、装置、设备和介质,可以在不同的直播场景下,提升直播音频编码质量,保证直播终端正常运行的同时,减少带宽资源的浪费。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种音频编码方法,包括:
[0006]确定当前观看直播的用户账户数量;
[0007]若所述用户账户数量大于或者等于第一用户账户数量阈值,且小于第二用户账户数量阈值,则确定直播终端的设备负载;
[0008]若所述设备负载大于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,并利用所述第一目标编码码率对所述直播音频进行编码。
[0009]可选的,所述方法还包括:
[0010]若所述用户账户数量小于第一用户账户数量阈值,则确定直播终端的设备负载;
[0011]若所述设备负载小于或者等于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,并利用所述第一目标编码码率对所述直播音频进行编码。
[0012]可选的,所述按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,包括:
[0013]获取第一预设时长的第一当前直播音频段;
[0014]将所述第一当前直播音频段,输入预先训练的音频类型识别模型中进行音频类型识别,得到所述第一当前直播音频段的第一音频类型;
[0015]在预先建立的音频类型与编码码率的第一对应关系表中,确定与所述第一音频类型对应的第一目标编码码率;
[0016]所述利用所述第一目标编码码率对所述直播音频进行编码,包括:
[0017]利用所述第一目标编码码率对所述第一预设时长的下一直播音频段进行编码。
[0018]可选的,所述方法还包括:
[0019]若所述设备负载大于设备负载阈值,则按照第二音频编码模式确定直播音频的第二音频类型,以及与所述第二音频类型对应的第二目标编码码率,并利用所述第二目标编码码率对所述直播音频进行编码。
[0020]可选的,所述按照第二音频编码模式确定直播音频的第二音频类型,以及与所述第二音频类型对应的第二目标编码码率,包括:
[0021]将当前帧直播音频的能量与背景噪声能量进行比较,确定所述当前帧直播音频的第二音频类型;
[0022]在预先建立的音频类型与编码码率的第二对应关系表中,确定与所述第二音频类型对应的第二目标编码码率;
[0023]所述利用所述第二目标编码码率对所述直播音频进行编码,包括:
[0024]利用所述第二目标编码码率对所述当前帧直播音频进行编码。
[0025]可选的,所述方法还包括:
[0026]若所述设备负载小于或者等于设备负载阈值,则按照第三音频编码模式确定直播音频的第三音频类型,以及与所述第三音频类型对应的第三目标编码码率,并利用所述第三目标编码码率对所述直播音频进行编码。
[0027]可选的,所述按照第三音频编码模式确定直播音频的第三音频类型,以及与所述第三音频类型对应的第三目标编码码率,包括:
[0028]获取第二预设时长的第二当前直播音频段;
[0029]将所述第二当前直播音频段,输入预先训练的音频类型识别模型中进行音频类型识别,得到所述第二当前直播音频段的第四音频类型;
[0030]将第二预设时长的下一直播音频段中,第一帧直播音频的能量与背景噪声能量进行比较,得到所述下一直播音频段中所述第一帧直播音频的第五音频类型;
[0031]根据所述第四音频类型和所述第五音频类型,确定所述第一帧直播音频的第三音频类型;
[0032]在预先建立的音频类型与编码码率的第三对应关系表中,确定与所述第三音频类型对应的第三目标编码码率;
[0033]所述利用所述第三目标编码码率对所述直播音频进行编码,包括:
[0034]利用所述第三目标编码码率对预设时长的下一直播音频段进行编码。
[0035]可选的,所述方法还包括:
[0036]若所述用户账户数量大于或者等于第二用户账户数量阈值,则按照第四目标编码码率对直播音频进行编码。
[0037]根据本公开实施例的第二方面,提供一种音频编码装置,包括:
[0038]第一确定模块,被配置为确定当前观看直播的用户账户数量;
[0039]第二确定模块,被配置为若所述用户账户数量大于或者等于第一用户账户数量阈值,且小于第二用户账户数量阈值,则确定直播终端的设备负载;
[0040]第一编码模块,被配置为若所述设备负载大于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码
率,并利用所述第一目标编码码率对所述直播音频进行编码;
[0041]可选的,所述装置还包括,第二编码模块,被配置为:
[0042]若所述用户账户数量小于第一用户账户数量阈值,则确定直播终端的设备负载;
[0043]若所述设备负载小于或者等于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,并利用所述第一目标编码码率对所述直播音频进行编码。
[0044]可选的,所述第一编码模块或者第二编码模块,被配置为:
[0045]获取第一预设时长的第一当前直播音频段;
[0046]将所述第一当前直播音频段,输入预先训练的音频类型识别模型中进行音频类型识别,得到所述第一当前直播音频段的第一音频类型;
[0047]在预先建立的音频类型与编码码率的第一对应关系表中,确定与所述第一音频类型对应的第一目标编码码率;
[0048]所述利用所述第一目标编码码率对所述直播音频进行编码,包括:
[0049]利用所述第一目标编码码率对所述第一预设时长的下一直播音频段进行编码。
[0050]可选的,所述装置还包括,第三编码模块,被配置为:
[0051]若所述设备负载大于设备负载阈值,则按照第二音频编码模式确定直播音频的第二音频类型,以及与所述第二音频类型对应的第二目标编本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频编码方法,其特征在于,包括:确定当前观看直播的用户账户数量;若所述用户账户数量大于或者等于第一用户账户数量阈值,且小于第二用户账户数量阈值,则确定直播终端的设备负载;若所述设备负载大于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,并利用所述第一目标编码码率对所述直播音频进行编码。2.根据权利要求1所述的音频编码方法,其特征在于,所述方法还包括:若所述用户账户数量小于第一用户账户数量阈值,则确定直播终端的设备负载;若所述设备负载小于或者等于设备负载阈值,则按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,并利用所述第一目标编码码率对所述直播音频进行编码。3.根据权利要求1或者2所述的音频编码方法,其特征在于,所述按照第一音频编码模式确定直播音频的第一音频类型,以及与所述第一音频类型对应的第一目标编码码率,包括:获取第一预设时长的第一当前直播音频段;将所述第一当前直播音频段,输入预先训练的音频类型识别模型中进行音频类型识别,得到所述第一当前直播音频段的第一音频类型;在预先建立的音频类型与编码码率的第一对应关系表中,确定与所述第一音频类型对应的第一目标编码码率;所述利用所述第一目标编码码率对所述直播音频进行编码,包括:利用所述第一目标编码码率对所述第一预设时长的下一直播音频段进行编码。4.根据权利要求2所述的音频编码方法,其特征在于,所述方法还包括:若所述设备负载大于设备负载阈值,则按照第二音频编码模式确定直播音频的第二音频类型,以及与所述第二音频类型对应的第二目标编码码率,并利用所述第二目标编码码率对所述直播音频进行编码。5.根据权利要求4所述的音频编码方法,其特征在于,所述按照第二音频编码模式确定直播音频的第二音频类型,以及与所述第二音频类型对应的第二目标编码码率,包括:将当前帧直播音频的能量与背景噪声能量进行比较,确定所述当前帧直播音频的第二音频类型;在预先建立的音频类型与编码码率的第二对应关系表中,确定与所述第二音频类型对应的第二目标编码码率;所述利用所述第二目标编码码率对所述直播音频进行编码,包括:利用所述第二目标编码码率对所述当前帧直播音频进行编码。6.根据权利要...

【专利技术属性】
技术研发人员:任新蕾邢文浩郑羲光张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1