音频识别的方法、设备和存储介质技术

技术编号:40059629 阅读:21 留言:0更新日期:2024-01-16 22:29
本公开公开了一种音频识别的方法、装置、设备和存储介质,属于音频技术领域。所述方法包括:获取待识别音频的第一频谱特征;获取所述待识别音频的第一偏移编码向量,其中,所述第一偏移编码向量用于指示所述待识别音频中的歌词的位置;将所述第一频谱特征和所述第一偏移编码向量,输入预先训练的旋律特征提取模型,得到第一旋律特征;计算所述第一旋律特征和曲库中各歌曲的旋律特征的相似度;根据所述相似度,确定所述待识别音频的识别结果。采用本公开可以有效提高音频识别的效率。

【技术实现步骤摘要】

本公开涉及音频,特别涉及一种音频识别的方法、设备和存储介质


技术介绍

1、听歌识曲技术通过将待识别音频和曲库中的歌曲进行严格的音频指纹匹配,在待识别音频的音频指纹和曲库中某歌曲的音频指纹完全匹配时,则认为识别成功。然而,在待识别音频属于翻唱歌曲且在曲库中没有该翻唱歌曲的情况下,即使在曲库中有相应的原创歌曲,通过严格的音频指纹匹配,也会无法精准匹配,导致识别失败。

2、目前,针对以上问题,在音频指纹匹配失败后,会进行采用翻唱识别技术继续进行识别,即,先对待识别音频进行分片,得到多个音频片段,然后,对多个音频片段分别提取旋律特征,进而,将这多个音频片段的旋律特征和曲库中歌曲的音频片段的旋律特征进行模糊匹配,以得到识别结果。

3、在上述翻唱识别技术中,要对待识别音频进行分片,如果待识别音频较长的话,会被分为较多音频片段,这样,后续旋律特征提取以及模糊匹配时,计算量都会比较大,导致识别效率较低。


技术实现思路

1、本公开实施例提供了一种音频识别的方法、装置、设备和存储介质,能够解决相关技术中本文档来自技高网...

【技术保护点】

1.一种音频识别的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述获取待识别音频的第一频谱特征之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述获取所述第一歌曲音频的第二偏移编码向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述获取所述第二歌曲音频的第三偏移编码向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述将所述第二频谱特征和所述第二偏移编码向量,输入待训练的旋律特征提取模型值之前,所述方法还包...

【技术特征摘要】

1.一种音频识别的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述获取待识别音频的第一频谱特征之前,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述获取所述第一歌曲音频的第二偏移编码向量,包括:

5.根据权利要求4所述的方法,其特征在于,所述获取所述第二歌曲音频的第三偏移编码向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述将所述第二频谱特征和所述第二偏移编码向量,输入待训练的旋律特征提取模型值之前,所述方法还包括:

【专利技术属性】
技术研发人员:王武城
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1