一种歌曲识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：23086717 阅读：28 留言：0更新日期：2020-01-11 01:44

本发明专利技术实施例公开了一种歌曲识别方法、装置、存储介质及电子设备。该方案通过获取目标歌曲片段，对目标歌曲片段进行变换处理，生成对应的第一频谱图；根据第一频谱图和预设的神经网络模型，生成多维的第一特征向量；获取预存歌曲的第二特征向量；计算第一特征向量与第二特征向量之间的相似度，并确定最大相似度；若最大相似度大于预设阈值，则判定目标歌曲片段与最大相似度对应的预存歌曲为同一首歌曲的不同版本，以提高对翻唱歌曲的识别准确率。

A song recognition method, device, storage medium and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种歌曲识别方法、装置、存储介质及电子设备
本专利技术涉及音频处理
，具体涉及一种歌曲识别方法、装置、存储介质及电子设备。
技术介绍
目前，用户可以通过输入相关的关键字搜索歌曲，例如歌曲名字或者歌词等。或者，当用户听到一段喜爱的旋律却不知道歌名的情况下，只需要用手机录制一段听到的歌曲片段，通过音乐软件的听歌识曲功能，即可识别出该片段所属的歌曲。但是，传统的听歌识曲方案，通常是通过音频指纹检索的方式获取歌曲的名称，能够实现对录制的原唱歌曲片段进行识别。但是对于翻唱的歌曲，例如，用户自己对歌曲片段进行哼唱识别时，识别准确度非常低。
技术实现思路
本专利技术实施例提供一种歌曲识别方法、装置、存储介质及电子设备，可以提高对翻唱歌曲的识别准确率。本专利技术实施例提供一种歌曲识别方法，包括：获取目标歌曲片段，对所述目标歌曲片段进行变换处理，生成对应的第一频谱图；根据所述第一频谱图和预设的神经网络模型，生成多维的第一特征向量；获取预存歌曲的第二特征向量，其中，一首预存歌曲分割为多个预存歌曲片段，一个预存歌曲片段对应一个第二特征向量，所述第一特征向量与所述第二特征向量的维数相等；计算所述第一特征向量与所述第二特征向量之间的相似度，并确定最大相似度；若所述最大相似度大于预设阈值，则判定所述目标歌曲片段与所述最大相似度对应的预存歌曲为同一首歌曲的不同版本。本专利技术实施例还提供一种歌曲识别装置，包括：音频变换单元，用于获取目标歌曲片段，对所...

【技术保护点】
1.一种歌曲识别方法，其特征在于，包括：/n获取目标歌曲片段，对所述目标歌曲片段进行变换处理，生成对应的第一频谱图；/n根据所述第一频谱图和预设的神经网络模型，生成多维的第一特征向量；/n获取预存歌曲的第二特征向量，其中，一首预存歌曲分割为多个预存歌曲片段，一个预存歌曲片段对应一个第二特征向量，所述第一特征向量与所述第二特征向量的维数相等；/n计算所述第一特征向量与所述第二特征向量之间的相似度，并确定最大相似度；/n若所述最大相似度大于预设阈值，则判定所述目标歌曲片段与所述最大相似度对应的预存歌曲为同一首歌曲的不同版本。/n

【技术特征摘要】
1.一种歌曲识别方法，其特征在于，包括：
获取目标歌曲片段，对所述目标歌曲片段进行变换处理，生成对应的第一频谱图；
根据所述第一频谱图和预设的神经网络模型，生成多维的第一特征向量；
获取预存歌曲的第二特征向量，其中，一首预存歌曲分割为多个预存歌曲片段，一个预存歌曲片段对应一个第二特征向量，所述第一特征向量与所述第二特征向量的维数相等；
计算所述第一特征向量与所述第二特征向量之间的相似度，并确定最大相似度；
若所述最大相似度大于预设阈值，则判定所述目标歌曲片段与所述最大相似度对应的预存歌曲为同一首歌曲的不同版本。

2.如权利要求1所述的歌曲识别方法，其特征在于，所述对所述目标歌曲片段进行处理，生成对应的第一频谱图，包括：
对所述目标歌曲片段进行短时傅里叶变换，生成对应的第一频谱图。

3.如权利要求1所述的歌曲识别方法，其特征在于，所述对所述目标歌曲片段进行变换处理，生成对应的第一频谱图，包括：
按照预设采样率对所述目标歌曲片段进行降采样处理；
对经过降采样处理后的目标歌曲片段进行变换处理，生成对应的第一频谱图。

4.如权利要求3所述的歌曲识别方法，其特征在于，所述按照预设采样率对所述目标歌曲片段进行降采样处理，包括：
判断所述目标歌曲片段的时长是否大于预设时长；
若是，则将所述目标歌曲片段的时长调整为预设时长；
按照所述预设采样率对预设时长的所述目标歌曲片段进行降采样处理。

5.如权利要求1所述的歌曲识别方法，其特征在于，所述神经网络模型包括卷积神经网络和分割编码网络；所述根据所述第一频谱图和预设的神经网络模型，生成多维的第一特征向量，包括：
将所述第一频谱图输入所述神经网络模型，在所述卷积神经网络中进行卷积运算，生成特征张量；
根据所述分割编码网络对所述特征张量进行编码处理，生成多维的第一特征向量。

6.如权利要求5所述的歌曲识别方法，其特征在于，所述分割编码网络包括输入层、数据分割层、全连接层和输出层；所述根据所述分割编码网络对所述特征张量进行编码处理，生成多维的第一特征向量，包括：
将所述特征张量输入所述分割编码网络，在所述输入层将所述特征张量转换为一维数据后，输入所述数据分割层；
在所述数据分割层将所述一维数据分割为n份，每一份连接至所述全连接层；
经过所述全连接层的运算后，由所述输出层输出n个特征值，所述n个特征值构成n维的第一特征向量，其中，n为大于1的正整数。

7.如权利要求...

【专利技术属性】
技术研发人员：孔令城，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人