The invention discloses an audio feature extraction method and device, which belongs to the field of audio processing. The audio feature extraction method includes: through the window window function M of the audio signal is divided into frames, samples obtained from the sample signal; signal selected signal frame in the first energy interval value corresponding to the energy; second is determined according to the energy range of the upper and lower limits of the signal frame meets a predetermined condition corresponding to the energy value; in the signal frame is selected, the corresponding energy values in the signal frame second energy interval determined to characterize the frame of the audio signal. The invention solves the related technology in the field of audio processing less audio signal feature extraction, increase the burden of the subsequent audio processing, to the audio signal feature extraction efficiency, improve the efficiency of subsequent audio processing effect.
【技术实现步骤摘要】
音频特征提取方法及装置
本专利技术实施例涉及音频处理领域,特别涉及一种音频特征提取方法及装置。
技术介绍
特征提取通常应用于图像处理中,在音频处理领域应用较少。但在基于内容的音乐辨识(MusicIdentification)服务、相似音乐推荐(MusicRecommendation)服务等音频识别服务等应用场景中,均需要用到音频特征。故,如何高效地对音频信号进行有效特征提取成为亟待解决的问题。
技术实现思路
为了解决现有技术中存在的问题,本专利技术实施例提供了一种音频特征提取方法及装置。技术方案如下:根据本专利技术实施例的第一方面,提供了一种音频特征提取方法,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。根据本专利技术实施例的第二方面,提供了一种音频特征提取装置,所述装置包括:分帧模块,用于通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;筛选模块,用于按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限 ...
【技术保护点】
一种音频特征提取方法,其特征在于,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。
【技术特征摘要】
1.一种音频特征提取方法,其特征在于,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。2.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:对所述音频信号进行傅里叶变换,得到音频信号对应的时域信号;按照归一化公式,对所述时域信号进行归一化处理;通过窗长为M的窗函数将归一化处理后的时域信号分为多帧,得到样本信号;其中,所述归一化公式为:其中,所述y(i)为第i个归一化处理后的时域信号,所述x(i)为第i个时域信号帧,xmax为取绝对值后的所述时域信号中,采样值最大的时域信号帧对应的采样值。3.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:按照窗长为M的窗函数对应的加窗公式,将所述音频信号分为多帧,得到所述样本信号;其中,所述加窗公式为:xw(n)=w(n)*x(n),其中,所述xw(n)为样本信号,所述xw(n)的帧数为L,所述x(n)为所述音频信号,所述w(n)为窗函数,所述n小于且等于N的自然数,所述L=N/M。4.根据权利要求1所述的方法,其特征在于,所述按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧,包括:计算所述样本信号中每一个信号帧的能量值;按照预定顺序对所述样本信号中的信号帧进行排序,得到信号帧序列;从所述信号帧序列中选取出第个信号帧和第个信号帧,将所述第个信号帧对应的能量值与所述第个信号帧对应的能量值中,能量值大的信号帧对应的能量值确定为所述第一能量区间的上限值,能量值小的信号帧对应的能量值确定为所述第一能量区间的下限值,所述R为正小数;在所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧。5.根据权利要求1所述的方法,其特征在于,所述根据所述符合预定条件的信号帧对应的能量值确定第二能量区间,包括:将确定出的信号帧对应的能量值减去第一预值得到第一数值,将所述确定出的信号帧对应的能量值乘以第二预值得到第二数值;在所述第一数值与所述第二数值中,将能量值大的数值确定为所述第二能量区间的上限值,将所述能量值大的数值对应的负值确定为所述第二能量区间的下限值。6.一种音频特征提取装置,其特征在于,所述装置包括:分帧模块,用于通过窗长为M的窗函数将音频信号分为多帧,得到样本...
【专利技术属性】
技术研发人员:赵伟峰,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。