检测伴奏回采的方法、装置、设备和存储介质制造方法及图纸

技术编号：36423408 阅读：39 留言：0更新日期：2023-01-20 22:32

本申请公开了一种检测伴奏回采的方法、装置、设备和存储介质，属于音频技术领域。所述方法包括：获取目标歌曲的伴奏音频和干声音频，其中所述干声音频为播放所述伴奏音频时采集的人声音频；在所述伴奏音频中，获取预设时长的伴奏音频片段，其中，所述伴奏音频片段在所述目标歌曲的歌词文件中对应的演奏时间内无歌词；并在所述干声音频中，获取所述伴奏音频片段的演奏时间对应的待比对音频片段；获取所述伴奏音频片段的第一音频特征，并获取所述待比对音频片段的第二音频特征；确定所述第一音频特征和所述第二音频特征的相似度，根据所述相似度是否满足预设相似度条件来确定是否存在伴奏回采。采用本申请，可以实现伴奏回采检测。测。测。

全部详细技术资料下载

【技术实现步骤摘要】
检测伴奏回采的方法、装置、设备和存储介质

[0001]本申请涉及音频
，特别涉及一种检测伴奏回采的方法、装置、设备和存储介质。

技术介绍

[0002]目前，常用的有线耳机的接头标准有OMTP(Open Mobile Terminal Platform，开放移动终端平台)标准和CTIA(Cellular Telecommunications Industry Association，无线通信和互联网协会)标准。
[0003]当前市场上的大部分手机可以同时支持OMTP标准和CTIA标准，然而，有一些型号的手机只支持其中一种标准。如果手机连接的是接头标准不支持的有线耳机，那么手机使用该有线耳机进行录歌时，可能会存在伴奏回采的问题。基于此，可以通过检测录歌时是否存在伴奏回采，来辅助判断手机是否支持录歌所用耳机的接口标准。
[0004]因此，目前亟需一种可以检测录歌时是否存在伴奏回采的方案。

技术实现思路

[0005]本申请实施例提供了一种检测伴奏回采的方法、装置、设备和存储介质。所述技术方案如下：
[000本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种检测伴奏回采的方法，其特征在于，所述方法包括：获取目标歌曲的伴奏音频和干声音频，其中，所述干声音频为播放所述伴奏音频时采集的人声音频；在所述伴奏音频中，获取预设时长的伴奏音频片段，其中，所述伴奏音频片段在所述目标歌曲的歌词文件中对应的演奏时间内无歌词；并在所述干声音频中，获取所述伴奏音频片段的演奏时间对应的待比对音频片段；获取所述伴奏音频片段的第一音频特征，并获取所述待比对音频片段的第二音频特征；确定所述第一音频特征和所述第二音频特征的相似度，根据所述相似度是否满足预设相似度条件来确定是否存在伴奏回采。2.根据权利要求1所述的方法，其特征在于，所述在所述伴奏音频中，获取预设时长的伴奏音频片段，包括：获取所述目标歌曲的歌词文件，其中，所述歌词文件中包括所述目标歌曲的歌词、以及所述歌词中每个字的演唱开始时间和演唱结束时间；在所述歌词文件中，如果确定相邻两个字之间的演唱时间间隔大于预设时长，则在所述相邻两个字对应的伴奏音频中，获取所述预设时长的伴奏音频片段，其中，所述相邻两个字之间的演唱时间间隔为所述相邻两个字中前一个字的演唱结束时间到后一个字的演唱开始时间之间的时间间隔。3.根据权利要求1所述的方法，其特征在于，所述获取所述伴奏音频片段的第一音频特征，并获取所述待比对音频片段的第二音频特征，包括：对所述伴奏音频片段进行分帧处理，得到所述伴奏音频片段对应的多个第一音频帧；确定每个第一音频帧的第一特征向量，并将每个第一音频帧的第一特征向量组合，得到所述伴奏音频片段的第一音频特征；对所述待比对音频片段进行分帧处理，得到所述待比对音频片段对应的多个第二音频帧；确定每个第二音频帧的第二特征向量，并将每个第二音频帧的第二特征向量组合，得到所述伴奏音频片段的第一音频特征。4.根据权利要求3所述的方法，其特征在于，所述确定每个第一音频帧的第一特征向量，包括：获取每个第一音频帧对应的第一频域信号，并根据每个第一频域信号，得到每个第一音频帧在N个频带的能量，其中，N为预设正整数；对于每个第一音频帧，根据所述第一音频帧在所述N个频带的能量和所述第一音频帧的前一个第一音频帧在所述N个频带的能量，确定所述第一音频帧的第一特征向量；所述确定每个第二音频帧的第二特征向量，包括：获取每个第二音频帧对应的第二频域信号，并根据每个第二频域信号，得到每个第二音频帧在所述N个频带的能量；对于每个第二音频帧，根据所述第二音频帧在所述N个频带的能量和所述第二音频帧的前一个第二音频帧在所述N个频带的能量，确定所述第二音频帧的第二特征向量。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一音频帧在所述N个频带
的能量和所述第一音频帧的前一个第一音频帧在所述N个频带的能量，确定所述第一音频帧的第一特征向量，包括：根据所述第一音频帧在所述N个频带中第n个频带的能量、所述第一音频帧在所述N个频带中第n+1个频带的能量、所述第一音频帧的前一个第一音频帧在所述第n个频带的能量、以及所述前一个第一音频帧在所述第n+1个频带的能量，确定所述第一音频帧的第一特征向量中第n个元素的取值，其中，1≤n≤N
‑
1；根据所述第一音频帧的第一特征向量中的每个元素取值，得到所述第一特征向量；根据所述第二音频帧在所述N个频带中第n个频带的能量、所述第二音频帧在所述N个频带中第n+1个频带的能量、所述第二音频帧的前一个第二音频帧在所述第n个频带的能量、以及所述前一个第二音频帧在所述第n+1个频带的能量，确定所述第二音频帧的第二特征向量中第n个元素的取值；根据所述第二音频帧的第二特征向量中的每个元素的取值，得到所述第二特征向量。6.根据权利要求5所述的方法，其特征在于，所述根据所述第一音频帧在所述N个频带中第n个频带的能量、所述第一音频帧在所述N个频带中第n+1个频带的能量、所述第一音频帧的前一个第一音频帧在所述第n个频带的能量、以及所述前一个第一音频帧在所述第n+1个频带的能量，确定所述第一音频帧的第一特征向量中第n个元素的取值，包括：计算所述第一音频帧在所述N个频带...

【专利技术属性】
技术研发人员：李博文，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人