音频播放控制方法及其装置、设备、介质、产品制造方法及图纸

技术编号:31745794 阅读:24 留言:0更新日期:2022-01-05 16:25
本申请涉及音频信号处理技术领域,公开一种音频播放控制方法及其装置、设备、介质、产品,所述方法包括:在网络直播过程中持续采集本地的外部输入音源产生的实时音频数据;检出预添加至所述本机播放音源的音频数据中被外放环回的参考信号,确定相应的环回延迟值;所述参考信号为人耳听力频带外的高频信号;控制本机播放音源的音频数据叠加所述环回延迟值后与所述实时音频数据相混音,获得校正后音频数据;将所述校正后音频数据作为网络直播的音频流输出。本申请通过实时计算音频环回延迟,无需用户额外操作,保证了网络直播、远程卡拉OK和直播唱歌场景中人声与伴奏对齐的问题,提升了用户体验。升了用户体验。升了用户体验。

【技术实现步骤摘要】
音频播放控制方法及其装置、设备、介质、产品


[0001]本申请涉及音频信号处理
,尤其涉及一种音频播放控制方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]在终端设备上进行卡拉ok以及直播唱歌场景中,设备播放音乐伴奏,主播演唱音乐,然后将主播演唱歌词和设备播放音乐伴奏混音后推送至远端,如图1所示。
[0003]图1中,混音的时间T4和采集时间T3的间隔很短,可以认为T4=T3。由于采集主播的声音时间为T3,而播放音乐时间为T1,如果在混音时没有时延补偿或补偿值不准确,则在远端会出现人声演唱T1时间的歌词,而伴奏却在播放其他时刻的伴奏,即人声与伴奏不同步,影响用户体验。
[0004]时延补偿的值即为音频环回延迟的值,环回延迟值是指终端设备外放的声音再被设备采集的时间间隔(上图中的T3

T1)。不同的音频接口、不同的平台(Android/IOS/MAC/WIN)、不同的厂家设备音频环回延迟各不同,因此,需要一种技术来计算音频环回延迟。一般来说,时延补偿的误差小于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频播放控制方法,其特征在于,包括如下步骤:在网络直播过程中持续采集本地的外部输入音源产生的实时音频数据;检出预添加至所述本机播放音源的音频数据中被外放环回的参考信号,确定相应的环回延迟值;所述参考信号为人耳听力频带外的高频信号;控制本机播放音源的音频数据叠加所述环回延迟值后与所述实时音频数据相混音,获得校正后音频数据;将所述校正后音频数据作为网络直播的音频流输出。2.根据权利要求1所述的音频播放控制方法,其特征在于,在网络直播过程中持续采集本地的外部输入音源产生的实时音频数据,包括如下步骤:获取本地播放音源相对应的音频数据进行外放;持续采集外部输入音源产生的外部语音信号;将所述外部语音信号转换为所述实时音频数据。3.根据权利要求1所述的音频播放控制方法,其特征在于,检出预添加至所述本机播放音源的音频数据中被外放环回的参考信号,确定相应的环回延迟值,包括如下步骤:构造所述参考信号;在第一时刻向本地播放音源的音频数据添加所述参考信号以供外放;启动对所述实时音频数据中的所述参考信号的检测,在检出该参考信号时确定出第二时刻;将第二时刻与第一时刻的差值确定为所述环回延迟值。4.根据权利要求3所述的音频播放控制方法,其特征在于,启动对所述实时音频数据中的所述参考信号的检测之后,包括如下步骤:对所述实时音频数据沿时域跟踪噪声信号;将所述噪声信号变换至频域,获得相应的噪声能量谱数据;根据所述实时音频数据的语音帧所映射的语音能量谱数据与所述噪声能量谱数据检测出所述参考信号。5....

【专利技术属性】
技术研发人员:何鑫苏嘉昌
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1