翻唱识别方法技术

技术编号:39839494 阅读:4 留言:0更新日期:2023-12-29 16:25
本申请实施例公开了翻唱识别方法

【技术实现步骤摘要】
翻唱识别方法、翻唱识别装置以及存储介质


[0001]本申请实施例涉及音频识别
,尤其涉及翻唱识别方法

翻唱识别装置以及存储介质


技术介绍

[0002]翻唱识别技术为一种基于音频数据的音乐检索技术,可以识别音频数据所翻唱的原唱歌曲,常用于听歌识曲

哼唱识别等音乐应用中

现有的翻唱识别技术为,获取歌曲检索库以及待检测的音频数据,该歌曲检索库中包含原唱歌曲的多个音频特征;将待检测的音频数据提取音频特征,将该音频特征与歌曲检索库中音频特征进行特征相似度对比,以在该歌曲检索库内,根据特征相似度识别该待检测的音频数据所翻唱的原唱歌曲

[0003]然而,歌曲检索库中可能存在音频特征较为相似的多个音频段,且较为相似的多个音频段属于不同的原唱歌曲,在使用歌曲检索库进行特征相似度对比时,这些较为相似的多个音频段容易产生误导,导致翻唱识别结果出现错误


技术实现思路

[0004]本申请实施例提供了翻唱识别方法

翻唱识别装置以及存储介质,能够提高翻唱识别的准确性

[0005]本申请实施例提供了一种翻唱识别方法,所述方法应用于检索库,所述检索库包括多个时间偏移的原唱音频切片的音频特征,包括:
[0006]获取待识别音频;
[0007]确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征;
[0008]基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度,从多个所述原唱音频切片中分别确定每一所述待识别音频切片匹配的备选原唱音频切片;
[0009]在切片偏移顺序上连续的多个所述待识别音频切片分别匹配的备选原唱音频切片中,确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片;
[0010]基于所述目标原唱音频切片的切片数量,从原唱音频中确定所述待识别音频对应的翻唱音频

[0011]进一步的,所述确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征包括:
[0012]获取预先训练的翻唱识别模型,所述翻唱识别模型是基于预设翻唱音频以及预设原唱音频训练得到的,所述预设翻唱音频为对所述预设原唱音频进行翻唱得到的音频;
[0013]将所述待识别音频中每个待识别音频切片输入所述翻唱识别模型,得到所述翻唱识别模型输出的所述待识别音频中每个待识别音频切片的音频特征

[0014]进一步的,所述基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度,从多个所述原唱音频切片中分别确定每一所述待识别音
频切片匹配的备选原唱音频切片包括:
[0015]确定所述待识别音频切片中任一音频切片的音频特征,与每一所述原唱音频切片的音频特征之间的特征相似度;
[0016]针对每一所述待识别音频切片,将满足预设相似度阈值的原唱音频切片作为所述待识别音频切片匹配的备选原唱音频切片

[0017]进一步的,所述确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片包括:
[0018]获取所述待识别音频切片对应的音频切片序列,所述音频切片序列中每一所述待识别音频切片具有对应的切片偏移顺序;
[0019]基于同一原唱音频中各个所述备选原唱音频切片的切片偏移顺序,将同一原唱音频中各个所述备选原唱音频切片排列于所述音频切片序列上;
[0020]基于所述音频切片序列上连续排列的备选原唱音频切片,确定所述目标原唱音频切片

[0021]进一步的,所述基于所述音频切片序列上连续排列的备选原唱音频切片,确定所述目标原唱音频切片包括:
[0022]确定所述音频切片序列上备选原唱音频切片是否为连续排列的音频切片;
[0023]若备选原唱音频切片为连续排列的音频切片,则确定连续排列的备选原唱音频切片,在对应的原唱音频的切片偏移顺序上是否为连续的音频切片;
[0024]若为连续的音频切片,则将连续排列的备选原唱音频切片作为所述目标原唱音频切片

[0025]进一步的,所述基于所述目标原唱音频切片的切片数量,从原唱音频中确定所述待识别音频对应的翻唱音频包括:
[0026]从所述目标原唱音频切片的切片数量中确定切片数量最多的目标原唱音频切片;
[0027]将所述切片数量最多的目标原唱音频切片对应的原唱音频,作为所述待识别音频对应的翻唱音频

[0028]进一步的,所述基于所述目标原唱音频切片的切片数量,从原唱音频中确定所述待识别音频对应的翻唱音频包括:
[0029]确定所述待识别音频切片匹配的每一备选原唱音频切片的相似度得分,所述相似度得分指示备选原唱音频切片与备选原唱音频切片对应的待识别音频切片之间的特征相似度大小;
[0030]确定所述待识别音频切片匹配的每一备选原唱音频切片的连续密度得分,所述连续密度得分与备选原唱音频切片对应的目标原唱音频切片的切片数量成正比;
[0031]将所述相似度得分与所述连续密度得分相加,得到所述待识别音频切片匹配的每一备选原唱音频切片的翻唱得分;
[0032]确定所述翻唱得分中的最大得分,将最大得分的备选原唱音频切片对应的原唱音频作为所述待识别音频对应的翻唱音频

[0033]进一步的,所述方法还包括;
[0034]基于预设切片偏移规则,对所述待识别音频进行切片,得到所述待识别音频的多个待识别音频切片;
[0035]基于所述预设切片偏移规则,对原唱音频进行切片,得到所述原唱音频的多个原唱音频切片

[0036]本申请实施例还提供了一种翻唱识别装置,包括:
[0037]中央处理器,存储器,输入输出接口,有线或无线网络接口,电源;
[0038]所述存储器为短暂存储存储器或持久存储存储器;
[0039]所述中央处理器配置为与所述存储器通信,在控制面功能实体上执行所述存储器中的指令操作以执行上述的方法

[0040]本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法

[0041]从以上技术方案可以看出,本申请实施例具有以下优点:
[0042]本申请实施例中,获取待识别音频;确定待识别音频中多个时间偏移的待识别音频切片的音频特征;基于每一待识别音频切片的音频特征与每一原唱音频切片的音频特征之间的特征相似度,从多个原唱音频切片中分别确定每一待识别音频切片匹配的备选原唱音频切片;在切片偏移顺序上连续的多个待识别音频切片分别匹配的备选原唱音频切片中,确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片;基于目标原唱音频切片的切片数量,从原唱音频中确定待识别音频对应的翻唱音频

通过属于同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种翻唱识别方法,所述方法应用于检索库,所述检索库包括多个时间偏移的原唱音频切片的音频特征,其特征在于,包括:获取待识别音频;确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征;基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度,从多个所述原唱音频切片中分别确定每一所述待识别音频切片匹配的备选原唱音频切片;在切片偏移顺序上连续的多个所述待识别音频切片分别匹配的备选原唱音频切片中,确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片;基于所述目标原唱音频切片的切片数量,从原唱音频中确定所述待识别音频对应的翻唱音频
。2.
根据权利要求1所述的翻唱识别方法,其特征在于,所述确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征包括:获取预先训练的翻唱识别模型,所述翻唱识别模型是基于预设翻唱音频以及预设原唱音频训练得到的,所述预设翻唱音频为对所述预设原唱音频进行翻唱得到的音频;将所述待识别音频中每个待识别音频切片输入所述翻唱识别模型,得到所述翻唱识别模型输出的所述待识别音频中每个待识别音频切片的音频特征
。3.
根据权利要求1所述的翻唱识别方法,其特征在于,所述基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度,从多个所述原唱音频切片中分别确定每一所述待识别音频切片匹配的备选原唱音频切片包括:确定所述待识别音频切片中任一音频切片的音频特征,与每一所述原唱音频切片的音频特征之间的特征相似度;针对每一所述待识别音频切片,将满足预设相似度阈值的原唱音频切片作为所述待识别音频切片匹配的备选原唱音频切片
。4.
根据权利要求1所述的翻唱识别方法,其特征在于,所述确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片包括:获取所述待识别音频切片对应的音频切片序列,所述音频切片序列中每一所述待识别音频切片具有对应的切片偏移顺序;基于同一原唱音频中各个所述备选原唱音频切片的切片偏移顺序,将同一原唱音频中各个所述备选原唱音频切片排列于所述音频切片序列上;基于所述音频切片序列上连续排列的备选原唱音频切片,确定所述目标原唱音频切片
。5.
根据权利要求4所述的翻唱识别方法,其特征在于,所述基于所述音频切片序列上连续排列的备选原唱音频切片,确定所述目标原唱...

【专利技术属性】
技术研发人员:王武城龚韬
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1