翻唱识别方法技术

技术编号：39839494 阅读：4 留言：0更新日期：2023-12-29 16:25

本申请实施例公开了翻唱识别方法

全部详细技术资料下载

【技术实现步骤摘要】
翻唱识别方法、翻唱识别装置以及存储介质

[0001]本申请实施例涉及音频识别
，尤其涉及翻唱识别方法
、
翻唱识别装置以及存储介质
。

技术介绍

[0002]翻唱识别技术为一种基于音频数据的音乐检索技术，可以识别音频数据所翻唱的原唱歌曲，常用于听歌识曲
、
哼唱识别等音乐应用中
。
现有的翻唱识别技术为，获取歌曲检索库以及待检测的音频数据，该歌曲检索库中包含原唱歌曲的多个音频特征；将待检测的音频数据提取音频特征，将该音频特征与歌曲检索库中音频特征进行特征相似度对比，以在该歌曲检索库内，根据特征相似度识别该待检测的音频数据所翻唱的原唱歌曲
。
[0003]然而，歌曲检索库中可能存在音频特征较为相似的多个音频段，且较为相似的多个音频段属于不同的原唱歌曲，在使用歌曲检索库进行特征相似度对比时，这些较为相似的多个音频段容易产生误导，导致翻唱识别结果出现错误
。

技术实现思路

[0004]本申请实施例提供了翻唱识别方法
、
翻唱识别装置以及存储介质，能够提高翻唱识别的准确性
。
[0005]本申请实施例提供了一种翻唱识别方法，所述方法应用于检索库，所述检索库包括多个时间偏移的原唱音频切片的音频特征，包括：
[0006]获取待识别音频；
[0007]确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征；
[0008]基于每一所述待识别音频切片的音频特征与每一所述原唱音...

【技术保护点】

【技术特征摘要】
1.
一种翻唱识别方法，所述方法应用于检索库，所述检索库包括多个时间偏移的原唱音频切片的音频特征，其特征在于，包括：获取待识别音频；确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征；基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度，从多个所述原唱音频切片中分别确定每一所述待识别音频切片匹配的备选原唱音频切片；在切片偏移顺序上连续的多个所述待识别音频切片分别匹配的备选原唱音频切片中，确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片；基于所述目标原唱音频切片的切片数量，从原唱音频中确定所述待识别音频对应的翻唱音频
。2.
根据权利要求1所述的翻唱识别方法，其特征在于，所述确定所述待识别音频中多个时间偏移的待识别音频切片的音频特征包括：获取预先训练的翻唱识别模型，所述翻唱识别模型是基于预设翻唱音频以及预设原唱音频训练得到的，所述预设翻唱音频为对所述预设原唱音频进行翻唱得到的音频；将所述待识别音频中每个待识别音频切片输入所述翻唱识别模型，得到所述翻唱识别模型输出的所述待识别音频中每个待识别音频切片的音频特征
。3.
根据权利要求1所述的翻唱识别方法，其特征在于，所述基于每一所述待识别音频切片的音频特征与每一所述原唱音频切片的音频特征之间的特征相似度，从多个所述原唱音频切片中分别确定每一所述待识别音频切片匹配的备选原唱音频切片包括：确定所述待识别音频切片中任一音频切片的音频特征，与每一所述原唱音频切片的音频特征之间的特征相似度；针对每一所述待识别音频切片，将满足预设相似度阈值的原唱音频切片作为所述待识别音频切片匹配的备选原唱音频切片
。4.
根据权利要求1所述的翻唱识别方法，其特征在于，所述确定属于同一原唱音频且切片偏移顺序连续的目标原唱音频切片包括：获取所述待识别音频切片对应的音频切片序列，所述音频切片序列中每一所述待识别音频切片具有对应的切片偏移顺序；基于同一原唱音频中各个所述备选原唱音频切片的切片偏移顺序，将同一原唱音频中各个所述备选原唱音频切片排列于所述音频切片序列上；基于所述音频切片序列上连续排列的备选原唱音频切片，确定所述目标原唱音频切片
。5.
根据权利要求4所述的翻唱识别方法，其特征在于，所述基于所述音频切片序列上连续排列的备选原唱音频切片，确定所述目标原唱...

【专利技术属性】
技术研发人员：王武城，龚韬，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人