一种音频样本的提取方法、设备、终端及存储介质技术

技术编号：26847587 阅读：29 留言：0更新日期：2020-12-25 13:12

本发明专利技术实施例公开了一种音频样本的提取方法、设备、终端及可读存储介质，方法包括：获取第一歌词文件中各歌词与第二歌词文件中各歌词的相似度大于预设相似度阈值的第一歌词和第二歌词；根据第一歌词文件中歌词与时间信息的第一映射关系确定第一歌词的第一时间信息，根据第二歌词文件中歌词与时间信息的第二映射关系确定第二歌词的第二时间信息；根据第一时间信息对第一音频文件进行裁剪得到第一子音频文件，根据第二时间信息对第二音频文件进行裁剪得到第二子音频文件；确定添加第一标注信息的第一子音频文件和添加第二标注信息的第二子音频文件为相同歌词片段的音频样本，满足了对提取音频样本的自动化、智能化需求，提高了提取音频样本的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频样本的提取方法、设备、终端及存储介质
本申请涉及数据处理
，尤其涉及一种音频样本的提取方法、设备、终端及存储介质。
技术介绍
在音频领域中，基于机器学习的算法绝大多数需要大量的音频训练样本用来做算法迭代训练，这也说明，拥有高效地收集大量音频样本的能力是必不可缺，也意义重大的。目前，在计算机听觉(音频)领域中，对于音频样本，收集的现成资源屈指可数，收集途径匮乏，主要采用人工标注收集的方式收集音频样本，然而人工的标注工作量极大、在统一标准上存在难度。因此，如何提高获取音频样本的效率非常重要。
技术实现思路
本专利技术实施例提供了一种音频样本的提取方法、设备、终端及存储介质，可以实现基于歌词文件提取相同歌词片段的音频样本，减少了工作量，满足了对提取音频样本的自动化、智能化需求，提高了提取音频样本的效率。第一方面，本专利技术实施例提供了一种音频样本的提取方法，包括：获取第一歌词文件和第二歌词文件，所述第一歌词文件中包括歌词与时间信息的第一映射关系，所述第二歌词文件中包括歌词与...

【技术保护点】
1.一种音频样本的提取方法，其特征在于，包括：/n获取第一歌词文件和第二歌词文件，所述第一歌词文件中包括歌词与时间信息的第一映射关系，所述第二歌词文件中包括歌词与时间信息的第二映射关系；/n计算所述第一歌词文件中的各歌词与所述第二歌词文件中的各歌词的相似度，并获取所述相似度大于预设相似度阈值的第一歌词文件中的第一歌词和第二歌词文件中的第二歌词；/n根据所述第一映射关系确定与所述第一歌词对应的第一时间信息，根据所述第二映射关系确定与所述第二歌词对应的第二时间信息；/n根据所述第一时间信息对所述第一歌词文件对应的第一音频文件进行裁剪得到第一子音频文件，以及根据所述第二时间信息对所述第二歌词文件对应...

【技术特征摘要】
1.一种音频样本的提取方法，其特征在于，包括：
获取第一歌词文件和第二歌词文件，所述第一歌词文件中包括歌词与时间信息的第一映射关系，所述第二歌词文件中包括歌词与时间信息的第二映射关系；
计算所述第一歌词文件中的各歌词与所述第二歌词文件中的各歌词的相似度，并获取所述相似度大于预设相似度阈值的第一歌词文件中的第一歌词和第二歌词文件中的第二歌词；
根据所述第一映射关系确定与所述第一歌词对应的第一时间信息，根据所述第二映射关系确定与所述第二歌词对应的第二时间信息；
根据所述第一时间信息对所述第一歌词文件对应的第一音频文件进行裁剪得到第一子音频文件，以及根据所述第二时间信息对所述第二歌词文件对应的第二音频文件进行裁剪得到第二子音频文件；
对所述第一子音频文件添加第一标注信息，并对所述第二子音频文件添加第二标注信息，以及确定所述添加第一标注信息的第一子音频文件和所述添加第二标注信息的第二子音频文件为相同歌词片段的音频样本，其中，所述第一标注信息和所述第二标注信息用于神经网络模型的训练。

2.根据权利要求1所述的方法，其特征在于，所述获取第一歌词文件和第二歌词文件，包括：
获取所述第一音频文件和所述第二音频文件；
对所述第一音频文件进行解析得到所述第一歌词文件，以及对所述第二音频文件进行解析得到所述第二歌词文件。

3.根据权利要求2所述的方法，其特征在于，所述对所述第一音频文件进行解析得到所述第一歌词文件，以及对所述第二音频文件进行解析得到所述第二歌词文件，包括：
按照指定文件格式对所述第一音频文件进行遍历分析，得到所述第一音频文件对应的各歌词的时间信息，并根据所述各歌词和各歌词的时间信息确定所述第一歌词文件，所述时间信息包括每句歌词对应的起始时间和歌词时长；
按照所述指定文件格式对所述第二音频文件进行遍历分析，得到所述第二音频文件对应的各歌词的时间信息，并根据所述各歌词和各歌词的时间信息确定所述第二歌词文件，所述时间信息包括每句歌词对应的起始时间和歌词时长。

4.根据权利要求3所述的方法，其特征在于，所述根据所述第一时间信息对所述第一歌词文件对应的第一音频文件进行裁剪得到第一子音频文件，以及根据所述第二时间信息对所述第二歌词文件对应的第二音频文件进行裁剪得到第二子音频文件，包括：
根据所述第一时间信息中所述第一歌词对应的起始时间和歌词时长，对所述第一音频文件进行裁剪，得到所述第一子音频文件；
根据所述第二时间信息中所述第二歌词对应的起始时间和歌词时长，对所述第二音频文件进行裁剪，得到所述第二子音频文件。

5.根据权利要求1所述的方法，其特征在于，所述计算所述第一歌词文件中的各歌词与所述第二歌词文件中的各歌词的相似度，包括：
根据预设规则确定所述第一歌词文件中各歌词与所述第二歌词文件中的各歌词的第三映射关系；

【专利技术属性】
技术研发人员：鲁霄，赵伟峰，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人