确定音频数据的重音位置的方法和装置制造方法及图纸

技术编号:18555539 阅读:63 留言:0更新日期:2018-07-28 12:06
本公开是关于一种确定音频数据的重音位置的方法和装置,属于音频技术领域。所述方法包括获取待确定的音频数据;基于谐波源分离算法,在所述音频数据中提取冲击音频数据;基于小波分析算法,确定所述冲击音频数据对应的小波域,其中,所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据;根据所述小波域中的波峰位置,确定所述音频数据的重音位置。采用本公开,确定音频数据的重音位置时,不仅可以应用在具有打击乐器演奏的音频数据,还可以应用在不具有打击乐器演奏的音频数据中,进而,其应用场景更加广泛。

【技术实现步骤摘要】
确定音频数据的重音位置的方法和装置
本公开是关于音频
,尤其是关于一种确定音频数据的重音位置的方法和装置。
技术介绍
一首歌曲的重音位置是指具有突出听感的部分在歌曲的播放时间轴上对应的时间点,简单的说就是歌曲中声强较大的位置,如锣、鼓等打击乐器的演奏时刻。在大部分音乐中,重音位置通常出现在鼓等打击乐器的演奏时刻,因此,相关技术中通常通过鼓点检测的方法确定音乐的重音位置,在实现本公开的过程中,专利技术人发现至少存在以下问题:检测鼓点等打击乐器的方法只适用于具有打击乐器演奏的音乐,不适用于没有打击乐器演奏的音乐,导致使用该方法确定歌曲中的重音位置具有一定的局限性。
技术实现思路
本公开提供了一种确定音频数据的重音位置的方法和装置,以克服相关技术中存在的问题。所述技术方案如下:根据本公开实施例,提供一种确定音频数据的重音位置的方法,所述方法包括:获取待确定的音频数据;基于谐波源分离算法,在所述音频数据中提取冲击音频数据;基于小波分析算法,确定所述冲击音频数据对应的小波域,其中,所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据;根据所述小波域中的波峰位置,确定所述音频数据的重音位置。可选的,所述基于谐波源分离算法,在音频数据中提取冲击音频数据,包括:基于短时傅里叶变换,将时域内的音频数据转换为频域内的音频数据;基于谐波源分离算法,在频域内的音频数据中提取冲击音频数据,其中,傅里叶变换公式为:F(ω)表示频域内的音频数据,f(t)表示时域内的音频数据,t表示时间,ω表示频率。可选的,所述基于谐波源分离算法,在音频数据中提取冲击音频数据,包括:基于预设的截止频率,对音频数据,进行低通滤波,得到滤波后的音频数据;基于谐波源分离技术,在所述滤波后的音频数据中提取冲击音频数据。可选的,所述根据所述小波域中的波峰位置,确定所述音频数据的重音位置,包括:基于预设的振幅阈值,对所述小波域,进行阈值过滤,得到阈值过滤后的小波域;根据所述阈值过滤后的小波域的波峰位置,确定所述音频数据的重音位置。可选的,所述方法还包括:根据预设的波峰值范围与重音等级的对应关系,以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定每个重音位置对应的重音等级。可选的,所述根据预设的波峰值范围与重音等级的对应关系,以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定每个重音位置对应的重音等级,包括:根据所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定最大波峰值和最小波峰值;根据所述最大波峰值、最小波峰值以及最大最小归一化算法,将每个重音位置对应的波峰值转换为0至1范围内的归一化值;根据每个重音位置的波峰值对应的归一化值,以及预设的归一化值范围与重音等级的对应关系,确定每个重音位置对应的重音等级。可选的,所述最大最小归一化算法的公式为:其中,A(max)表示最大波峰值,A(min)表示最小波峰值,A(i)表示任一重音位置对应的波峰值,a(i)表示A(i)对应的归一化值。根据本公开实施例,提供一种确定音频数据的重音位置的装置,所述装置包括:获取模块,用于获取待确定的音频数据;提取模块,用于基于谐波源分离算法,在所述音频数据中提取冲击音频数据;第一确定模块,用于基于小波分析算法,确定所述冲击音频数据对应的小波域,其中,所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据;第二确定模块,用于根据所述小波域中的波峰位置,确定所述音频数据的重音位置。可选的,所述提取模块,包括:第一转换单元,用于基于短时傅里叶变换,将时域内的音频数据转换为频域内的音频数据;第一提取单元,用于基于谐波源分离算法,在频域内的音频数据中提取冲击音频数据,其中,傅里叶变换公式为:F(ω)表示频域内的音频数据,f(t)表示时域内的音频数据,t表示时间,ω表示频率。可选的,所述提取模块,包括:滤波单元,用于基于预设的截止频率,对音频数据,进行低通滤波,得到滤波后的音频数据;第二提取单元,用于基于谐波源分离技术,在所述滤波后的音频数据中提取冲击音频数据。可选的,所述第二确定模块,用于:基于预设的振幅阈值,对所述小波域,进行阈值过滤,得到阈值过滤后的小波域;根据所述阈值过滤后的小波域的波峰位置,确定所述音频数据的重音位置。可选的,所述装置还包括:第三确定模块,用于根据预设的波峰值范围与重音等级的对应关系,以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定每个重音位置对应的重音等级。可选的,所述第三确定模块包括:第一确定单元,用于根据所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定最大波峰值和最小波峰值;第二转换单元,用于根据所述最大波峰值、最小波峰值以及最大最小归一化算法,将每个重音位置对应的波峰值转换为0至1范围内的归一化值;第二确定单元,用于根据每个重音位置的波峰值对应的归一化值,以及预设的归一化值范围与重音等级的对应关系,确定每个重音位置对应的重音等级。可选的,所述最大最小归一化算法的公式为:其中,A(max)表示最大波峰值,A(min)表示最小波峰值,A(i)表示任一重音位置对应的波峰值,a(i)表示A(i)对应的归一化值。根据本公开实施例,还提供了一种设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现上述所述的确定音频数据的重音位置的方法。根据本公开实施例,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述所述的确定音频数据的重音位置的方法。本公开的实施例提供的技术方案可以包括以下有益效果:本公开实施例中,不论是对于具有打击乐器演奏的音频数据,还是对于不具有打击乐器演奏的音频数据,在确定其重音位置时,都可以在其音频数据中提取到相对具有突出听感的冲击音频数据,且整个音频数据的各部分都会存在相对具有突出听感的冲击音频数据,其中,音频数据的重音位置通常是分布在上述具有突出听感的冲击音频数据中。之后,再利用小波分析算法,将冲击音频数据中不是重音位置的音频数据衰减掉,以突出重音位置,进而,可以准确确定音频数据的重音位置。可见,上述确定音频数据的重音位置的方法不仅可以应用在具有打击乐器演奏的音频数据,还可以应用在不具有打击乐器演奏的音频数据中,进而,其应用场景更加广泛。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。在附图中:图1是根据实施例示出的一种确定音频数据的重音位置的方法流程图;图2是根据实施例示出的一种音频数据的原始声谱图的示意图;图3是根据实施例示出的一种冲击音频数据对应的声谱图的示意图;图4是根据实施例示出的一种小波图形示意图;图5是根据实施例示出的一种经过“最大最小归一化”算法处理后,确定的重音位置的示意图;图6是根据实施例示出的一种确定音频数据的重音位置的装置示意图;图7是根据实施例示出的一种确定音频数据的重音位置的装置示意图;图8是根据实施例示出的一种确定音频数据的重音位置的装置示意图;图9是根据实施例示出的一种确定音频数据的重音位置的装置示意图;图10是根本文档来自技高网...

【技术保护点】
1.一种确定音频数据的重音位置的方法,其特征在于,所述方法包括:获取待确定的音频数据;基于谐波源分离算法,在所述音频数据中提取冲击音频数据;基于小波分析算法,确定所述冲击音频数据对应的小波域,其中,所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据;根据所述小波域中的波峰位置,确定所述音频数据的重音位置。

【技术特征摘要】
1.一种确定音频数据的重音位置的方法,其特征在于,所述方法包括:获取待确定的音频数据;基于谐波源分离算法,在所述音频数据中提取冲击音频数据;基于小波分析算法,确定所述冲击音频数据对应的小波域,其中,所述小波域为所述冲击音频数据经过小波分析算法得到的波形数据;根据所述小波域中的波峰位置,确定所述音频数据的重音位置。2.根据权利要求1所述的方法,其特征在于,所述基于谐波源分离算法,在音频数据中提取冲击音频数据,包括:基于短时傅里叶变换,将时域内的音频数据转换为频域内的音频数据;基于谐波源分离算法,在频域内的音频数据中提取冲击音频数据,其中,傅里叶变换公式为:F(ω)表示频域内的音频数据,f(t)表示时域内的音频数据,t表示时间,ω表示频率。3.根据权利要求1所述的方法,其特征在于,所述基于谐波源分离算法,在音频数据中提取冲击音频数据,包括:基于预设的截止频率,对音频数据,进行低通滤波,得到滤波后的音频数据;基于谐波源分离技术,在所述滤波后的音频数据中提取冲击音频数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述小波域中的波峰位置,确定所述音频数据的重音位置,包括:基于预设的振幅阈值,对所述小波域,进行阈值过滤,得到阈值过滤后的小波域;根据所述阈值过滤后的小波域的波峰位置,确定所述音频数据的重音位置。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据预设的波峰值范围与重音等级的对应关系,以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定每个重音位置对应的重音等级。6.根据权利要求5所述的方法,其特征在于,所述根据预设的波峰值范围与重音等级的对应关系,以及所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定每个重音位置对应的重音等级,包括:根据所述阈值过滤后的小波域中的每个波峰位置对应的波峰值,确定最大波峰值和最小波峰值;根据所述最大波峰值、最小波峰值以及最大最小归一化算法,将每个重音位置对应的波峰值转换为0至1范围内的归一化值;根据每个重音位置的波峰值对应的归一化值,以及预设的归一化值范围与重音等级的对应关系,确定每个重音位置对应的重音等级。7.根据权利要求6所述的方法,其特征在于,所述最大最小归一化算法的公式为:其中,A(max)表示最大波峰值,A(min)表示最小波峰值,A(i)表示任一重音位置对应的波峰值,a(i)表示A(i)对应的归一化值。8.一种确定音频数据的重音位置的装置,其特征在于,所述装置包括:获取模块,用于获取待确定的音频数据;提取模块,用于基于谐波源分离算法,在所述音频数据中提取冲击音频...

【专利技术属性】
技术研发人员:王征韬赵伟峰
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1