确定音频数据的重音位置的方法和装置制造方法及图纸

技术编号：18555539 阅读：63 留言：0更新日期：2018-07-28 12:06

本公开是关于一种确定音频数据的重音位置的方法和装置，属于音频技术领域。所述方法包括获取待确定的音频数据；基于谐波源分离算法，在所述音频数据中提取冲击音频数据；基于小波分析算法，确定所述冲击音频数据对应的小波域，其中，所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据；根据所述小波域中的波峰位置，确定所述音频数据的重音位置。采用本公开，确定音频数据的重音位置时，不仅可以应用在具有打击乐器演奏的音频数据，还可以应用在不具有打击乐器演奏的音频数据中，进而，其应用场景更加广泛。

全部详细技术资料下载

【技术实现步骤摘要】
确定音频数据的重音位置的方法和装置
本公开是关于音频
，尤其是关于一种确定音频数据的重音位置的方法和装置。
技术介绍
一首歌曲的重音位置是指具有突出听感的部分在歌曲的播放时间轴上对应的时间点，简单的说就是歌曲中声强较大的位置，如锣、鼓等打击乐器的演奏时刻。在大部分音乐中，重音位置通常出现在鼓等打击乐器的演奏时刻，因此，相关技术中通常通过鼓点检测的方法确定音乐的重音位置，在实现本公开的过程中，专利技术人发现至少存在以下问题：检测鼓点等打击乐器的方法只适用于具有打击乐器演奏的音乐，不适用于没有打击乐器演奏的音乐，导致使用该方法确定歌曲中的重音位置具有一定的局限性。
技术实现思路
本公开提供了一种确定音频数据的重音位置的方法和装置，以克服相关技术中存在的问题。所述技术方案如下：根据本公开实施例，提供一种确定音频数据的重音位置的方法，所述方法包括：获取待确定的音频数据；基于谐波源分离算法，在所述音频数据中提取冲击音频数据；基于小波分析算法，确定所述冲击音频数据对应的小波域，其中，所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据；根据所述小波域中的波峰位置，确定所述音频数据的重音位置。可选的，所述基于谐波源分离算法，在音频数据中提取冲击音频数据，包括：基于短时傅里叶变换，将时域内的音频数据转换为频域内的音频数据；基于谐波源分离算法，在频域内的音频数据中提取冲击音频数据，其中，傅里叶变换公式为：F(ω)表示频域内的音频数据，f(t)表示时域内的音频数据，t表示时间，ω表示频率。可选的，所述基于谐波源分离算法，在音频数据中提取冲击音频数据，包括：基于预设的截...

【技术保护点】
1.一种确定音频数据的重音位置的方法，其特征在于，所述方法包括：获取待确定的音频数据；基于谐波源分离算法，在所述音频数据中提取冲击音频数据；基于小波分析算法，确定所述冲击音频数据对应的小波域，其中，所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据；根据所述小波域中的波峰位置，确定所述音频数据的重音位置。

【技术特征摘要】
1.一种确定音频数据的重音位置的方法，其特征在于，所述方法包括：获取待确定的音频数据；基于谐波源分离算法，在所述音频数据中提取冲击音频数据；基于小波分析算法，确定所述冲击音频数据对应的小波域，其中，所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据；根据所述小波域中的波峰位置，确定所述音频数据的重音位置。2.根据权利要求1所述的方法，其特征在于，所述基于谐波源分离算法，在音频数据中提取冲击音频数据，包括：基于短时傅里叶变换，将时域内的音频数据转换为频域内的音频数据；基于谐波源分离算法，在频域内的音频数据中提取冲击音频数据，其中，傅里叶变换公式为：F(ω)表示频域内的音频数据，f(t)表示时域内的音频数据，t表示时间，ω表示频率。3.根据权利要求1所述的方法，其特征在于，所述基于谐波源分离算法，在音频数据中提取冲击音频数据，包括：基于预设的截止频率，对音频数据，进行低通滤波，得到滤波后的音频数据；基于谐波源分离技术，在所述滤波后的音频数据中提取冲击音频数据。4.根据权利要求1所述的方法，其特征在于，所述根据所述小波域中的波峰位置，确定所述音频数据的重音位置，包括：基于预设的振幅阈值，对所述小波域，进行阈值过滤，得到阈值过滤后的小波域；根据所述阈值过滤后的小波域的波峰位置，确定所述音频数据的重音位置。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：根据预设的波峰值范围与重音等级的对应关系，以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值，确定每个重音位置对应的重音等级。6.根据权利要求5所述的方法，其特征在于，所述根据预设的波峰值范围与重音等级的对应关系，以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值，确定每个重音位置对应的重音等级，包括：根据所述阈值过滤后的小波域中的每个波峰位置对应的波峰值，确定最大波峰值和最小波峰值；根据所述最大波峰值、最小波峰值以及最大最小归一化算法，将每个重音位置对应的波峰值转换为0至1范围内的归一化值；根据每个重音位置的波峰值对应的归一化值，以及预设的归一化值范围与重音等级的对应关系，确定每个重音位置对应的重音等级。7.根据权利要求6所述的方法，其特征在于，所述最大最小归一化算法的公式为：其中，A(max)表示最大波峰值，A(min)表示最小波峰值，A(i)表示任一重音位置对应的波峰值，a(i)表示A(i)对应的归一化值。8.一种确定音频数据的重音位置的装置，其特征在于，所述装置包括：获取模块，用于获取待确定的音频数据；提取模块，用于基于谐波源分离算法，在所述音频数据中提取冲击音频...

【专利技术属性】
技术研发人员：王征韬，赵伟峰，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人