【技术实现步骤摘要】
检测音频的节奏点的方法、装置、设备及可读存储介质
本申请涉及音频处理
,具体涉及一种检测音频的节奏点的方法、装置、设备及可读存储介质。
技术介绍
架子鼓是一种常用的乐器,在大部分歌曲音频中都存在架子鼓发出的鼓声。在歌曲音频中某些出现鼓声的时间点可以称为鼓点(鼓点也可以称为节奏点)。根据歌曲音频在鼓点的鼓声的不同,鼓点可以分为低频鼓点、中频鼓点和高频鼓点,其中,歌曲音频在低频鼓点存在击打底鼓发出的声音,在中频鼓点存在击打军鼓或嗵鼓发出的声音,在高频鼓点存在击打镲发出的声音。低频鼓点、中频鼓点和高频鼓点还可以称为低频节奏点、中频节奏点和高频节奏点。在歌曲音频中提取出各种类型的节奏点之后,可以利用节奏点做一些有趣的应用,例如,在以歌曲音频为背景音乐的视频中,可以在歌曲音频的中频节奏点,进行视频场景的切换,以增强视频的节奏感。相关技术中检测歌曲音频的节奏点时,通过检测歌曲音频在各个时间点的能量来确定歌曲音频的各个节奏点,例如,如果歌曲音频在某一时间点的能量满足中频能量特征,则确定该时间点为中频节奏点。在 ...
【技术保护点】
1.一种检测音频的节奏点的方法,其特征在于,所述方法包括:/n获取待检测音频;/n对所述待检测音频进行音轨分离,得到鼓声音频;/n基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点。/n
【技术特征摘要】
1.一种检测音频的节奏点的方法,其特征在于,所述方法包括:
获取待检测音频;
对所述待检测音频进行音轨分离,得到鼓声音频;
基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点。
2.根据权利要求1所述的方法,其特征在于,所述基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点,包括:
将所述鼓声音频输入到所述节奏点预测神经网络模型中,得到所述待检测音频的多种类型的节奏点。
3.根据权利要求1所述的方法,其特征在于,所述基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点,包括:
将所述鼓声音频输入到所述节奏点预测神经网络模型中,得到所述待检测音频的多个节奏点;
基于所述鼓声音频在每个节奏点的能量,确定每个节奏点的类型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述鼓声音频在每个节奏点的能量,确定每个节奏点的类型,包括:
确定低频、中频和高频的频域范围;
检测所述鼓声音频在各个节奏点的低频能量、中频能量和高频能量;
对于每个节奏点,如果所述鼓声音频在所述节奏点的低频能量满足目标低频能量特征,则确定所述节奏点为低频节奏点,如果所述鼓声音频在所述节奏点的中频能量满足目标中频能量特征,则确定所述节奏点为中频节奏点,如果所述鼓声音频在所述节奏点的高频能量满足目标高频能量特征,则确定所述节奏点为高频节奏点。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个训练音频;
对每个训练音频进行音轨分离,得到多个训练鼓声音频;
在所述多个训练鼓声音频中标记出各个节奏点...
【专利技术属性】
技术研发人员:劳振锋,陈传艺,
申请(专利权)人:广州酷狗计算机科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。