音频数据处理方法、装置、设备及介质制造方法及图纸

技术编号：38317861 阅读：14 留言：0更新日期：2023-07-29 09:00

本公开的实施方式提供了一种音频数据处理方法、装置、设备及介质。本公开通过在对原唱音频数据进行片段切分，得到原唱音频数据对应的多个原唱音频片段的情况下，获取每个原唱音频片段的第一歌词字符串以及至少一个备选翻唱音频数据中每个备选翻唱音频数据的第二歌词字符串，从而基于每个原唱音频片段对应的第一歌词字符串，在每个第二歌词字符串中进行匹配，以从至少一个备选翻唱音频数据中确定与该原唱音频片段匹配的翻唱音频片段，以实现原唱音频片段和翻唱音频片段的匹配，匹配的原唱音频片段和翻唱音频片段后续即可作为用于构建特征提取规则的训练数据，从而即可实现对训练数据的扩充。数据的扩充。数据的扩充。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法、装置、设备及介质

[0001]本公开的实施方式涉及多媒体
，更具体地，本公开的实施方式涉及一种音频数据处理方法、装置、设备及介质。

技术介绍

[0002]本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着短视频、综艺、直播的流行，翻唱歌曲的数量越来越多，需要识曲的场景也越来越复杂，传统的听歌识曲功能已经无法满足用户多元化、个性化的识别需求，因而，翻唱识别功能应运而生。通过翻唱识别功能，用户可以实现原唱歌曲片段和翻唱歌曲片段的匹配，让歌曲查找过程变得更加精准便捷。
[0004]在通过翻唱识别功能匹配原唱歌曲和翻唱歌曲时，按照预先确定好的规则，提取足够表征歌曲片段属性的特征，从而基于提取到的特征完成原唱歌曲片段和翻唱歌曲片段的相似度匹配，以找到翻唱歌曲片段对应的原唱歌曲。而构建规则的过程中需要大量的训练数据，因此，亟需一种音频数据处理方法，以找到原唱歌曲中的原唱歌曲片段对应的翻唱歌曲片段，进而将原唱歌曲片段及对应的翻唱歌曲片段构建为翻唱对，以将翻唱对作为用于构建规则的训练数据。

技术实现思路

[0005]但是，出于相关技术中作为训练数据的原唱歌曲和翻唱歌曲数量不足的原因，从而使得构建出的特征提取规则无法提取到能有效表征歌曲片段属性的特征，进而导致翻唱歌曲与原唱歌曲匹配的准确性较差。
[0006]基于这种情况，在本上下文中，本公开的实施方式期望提供一种音频数据处理方法，以基于有限数量的原唱歌曲和翻唱...

【技术保护点】

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，所述方法包括：对原唱音频数据进行片段切分，得到所述原唱音频数据对应的多个原唱音频片段；获取每个原唱音频片段的第一歌词字符串以及至少一个备选翻唱音频数据中每个备选翻唱音频数据的第二歌词字符串；对于任一原唱音频片段，基于所述第一歌词字符串，在每个第二歌词字符串中进行匹配，以从所述至少一个备选翻唱音频数据中确定与所述原唱音频片段匹配的翻唱音频片段。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一歌词字符串，在每个第二歌词字符串中进行匹配，以从所述至少一个备选翻唱音频数据中确定与所述原唱音频片段匹配的翻唱音频片段，包括：基于所述第一歌词字符串在每个第二歌词字符串中进行匹配，以从至少一个第二歌词字符串中确定出与所述第一歌词字符串匹配的目标翻唱歌词字符串；按照所述目标翻唱歌词字符串的起止位置所对应的时间戳，对所述目标翻唱歌词字符串对应的备选翻唱音频数据进行片段切分，得到与所述原唱音频片段匹配的翻唱音频片段。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一歌词字符串在每个第二歌词字符串中进行匹配，以从至少一个第二歌词字符串中确定出与所述第一歌词字符串匹配的目标翻唱歌词字符串，包括：基于所述第一歌词字符串中的部分字符，在每个第二歌词字符串中进行匹配，以从至少一个第二歌词字符串中确定至少一个备选翻唱歌词字符串；按照所述第一歌词字符串的字符串长度，对所述至少一个备选翻唱歌词字符串进行扩展，得到至少一个待匹配歌词字符串；基于每个待匹配歌词字符串与所述第一歌词字符串的相似度，从所述至少一个待匹配歌词字符串中确定与所述第一歌词字符串匹配的目标翻唱歌词字符串。4.根据权利要求3所述的方法，其特征在于，所述基于所述第一歌词字符串中的部分字符，在每个第二歌词字符串中进行匹配，以从至少一个第二歌词字符串中确定至少一个备选翻唱歌词字符串，包括：对于任一第二歌词字符串，遍历所述第二歌词字符串，以确定所述第二歌词字符串所对应的多个字符串片段与所述第一歌词字符串中的部分字符的相似度...

【专利技术属性】
技术研发人员：郑思远，潘颂声，李鹏，赵翔宇，刘华平，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人