音频特征提取方法及装置制造方法及图纸

技术编号:16758099 阅读:58 留言:0更新日期:2017-12-09 03:28
本发明专利技术公开了一种音频特征提取方法及装置,属于音频处理领域。该音频特征提取方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号;从样本信号中筛选出对应的能量值处于第一能量区间的信号帧;根据符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在筛选出的信号帧中,将对应的能量值处于第二能量区间的信号帧确定为音频信号的特征帧。本发明专利技术解决了相关技术中在音频处理领域应用中较少对音频信号进行特征提取,增加后续音频处理的负担的问题,达到了对音频信号进行特征进行高效提取,提高后续音频处理的效率的效果。

Audio feature extraction method and device

The invention discloses an audio feature extraction method and device, which belongs to the field of audio processing. The audio feature extraction method includes: through the window window function M of the audio signal is divided into frames, samples obtained from the sample signal; signal selected signal frame in the first energy interval value corresponding to the energy; second is determined according to the energy range of the upper and lower limits of the signal frame meets a predetermined condition corresponding to the energy value; in the signal frame is selected, the corresponding energy values in the signal frame second energy interval determined to characterize the frame of the audio signal. The invention solves the related technology in the field of audio processing less audio signal feature extraction, increase the burden of the subsequent audio processing, to the audio signal feature extraction efficiency, improve the efficiency of subsequent audio processing effect.

【技术实现步骤摘要】
音频特征提取方法及装置
本专利技术实施例涉及音频处理领域,特别涉及一种音频特征提取方法及装置。
技术介绍
特征提取通常应用于图像处理中,在音频处理领域应用较少。但在基于内容的音乐辨识(MusicIdentification)服务、相似音乐推荐(MusicRecommendation)服务等音频识别服务等应用场景中,均需要用到音频特征。故,如何高效地对音频信号进行有效特征提取成为亟待解决的问题。
技术实现思路
为了解决现有技术中存在的问题,本专利技术实施例提供了一种音频特征提取方法及装置。技术方案如下:根据本专利技术实施例的第一方面,提供了一种音频特征提取方法,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。根据本专利技术实施例的第二方面,提供了一种音频特征提取装置,所述装置包括:分帧模块,用于通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;筛选模块,用于按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;第一确定模块,用于对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;第二确定模块,用于在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。根据本专利技术实施例的第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如第一方面所述的音频特征提取方法。根据本专利技术实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如第一方面所述的音频特征提取方法。本专利技术实施例提供的技术方案带来的有益效果是:分别计算加窗分帧处理后的音频信号中的信号帧,并根据能量值对信号帧进行二次筛选,由于二次筛选后的信号帧中会过滤掉能量值较低和能量值较高的信号帧,即过滤掉掉可能为空白无效的信号帧和可能为噪声的信号帧;解决了相关技术中在音频处理领域应用中较少对音频信号进行特征提取,增加后续音频处理的负担的问题,达到了对音频信号进行特征进行高效提取,提高后续音频处理的效率的效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1A是本专利技术一个实施例中提供的音频特征提取方法的流程图;图1B是本专利技术一个实施例中提供的根据符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值方法的流程图;图2是本专利技术另一个实施例中提供的音频特征提取方法的流程图;图3是本专利技术一个实施例提供的音频特征提取装置的结构方框图;图4是本专利技术一个实施例提供的终端的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。图1A是本专利技术一个实施例中提供的音频特征提取方法的流程图,如图1A所示,该音频特征提取方法包括以下步骤。步骤101,通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,该M为自然数。在本专利技术实施例中,音频文件中的音频信号属于短时平稳过程,通过进行分帧加窗,将音频信号进行分段处理,可以得到视为平稳过程的帧信号,分帧加窗后得到的音频信号即为样本信号。通过一个长度为M的窗函数,可将原始输入的音频信号分为多帧并进行处理,分帧步骤一般以20-30ms为一帧,帧移为帧与相邻帧交叠的部分,为了避免帧间的特性变化太大一般取帧长的1/3或1/2作为帧移。加窗步骤为用原来的音频信号乘以一个窗函数,该过程可用公式(1)表示:xw(n)=w(n)*x(n)公式(1)在该公式(1)中,xw(n)为样本信号,x(n)为音频信号,w(n)为窗函数,n为自然数,0≤n≤N-1。在该公式(1)中,xw(n)长度为M,M优选地满足长度为2的幂,xw(n)的帧数为L,L=N/M。需要说明的是,常用的窗函数有矩形窗、汉宁窗和汉明窗,但本实施例不对窗函数的具体类型做任何限定。具体的,当窗函数分别为矩形窗、汉宁窗和汉明窗时,三个窗函数依次如下所示:步骤102,按照预定规则从样本信号中选取出两个信号帧,将两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从样本信号中筛选出对应的能量值处于第一能量区间的信号帧。在一种可能实现的方式中,步骤102可由下述步骤S1至步骤S4实现。步骤S1,计算样本信号中每一个信号帧的能量值。具体的,按照能量值计算公式,计算样本信号中每一个信号帧的能量值,得到样本信号对应的能量值E(L)。其中,能量值计算公式为:步骤S2,按照预定顺序对样本信号中的信号帧进行排序,得到信号帧序列。其中,预定顺序可为能量值递增顺序或者能量值递减顺序。步骤S3,从信号帧序列中选取出第个信号帧和第个信号帧,将第个信号帧对应的能量值与第个信号帧对应的能量值中,能量值大的信号帧对应的能量值确定为第一能量区间的上限值,能量值小的信号帧对应的能量值确定为第一能量区间的下限值,该R为正小数。其中,[]为取整符号。需要说明的是,R由人为设定或者系统预设。当R由人为设定时,第一能量区间由人为设定,当R由系统预设时,第一能量区间由系统设定。比如,xw(n)的帧数为1000,R设置为0.5,则从信号帧序列中选取出第250个信号帧和第375个信号帧。当预定顺序为能量值递增顺序时,将第个信号帧对应的能量值确定为第一能量区间的上限值,将第个信号帧对应的能量值确定为第一能量区间的下限值。当预定顺序为能量值递减顺序时,将第个信号帧对应的能量值确定为第一能量区间的上限值,将第个信号帧对应的能量值确定为第一能量区间的下限值。比如,xw(n)的帧数为1000,R设置为0.5,那么,当预定顺序为能量值递增顺序时,将第375个信号帧对应的能量值确定为第一能量区间的上限值,将第250个信号帧对应的能量值确定为第一能量区间的下限值;当预定顺序为能量值递减顺序时,将第250个信号帧对应的能量值确定为第一能量区间的上限值,将第375个信号帧对应的能量值确定为第一能量区间的下限值。步骤S4,在样本信号中筛选出对应的能量值处于第一能量区间的信号帧。遍历样本信号对应的能量值E,从样本信号中筛选出能量值处于第一能量区间的信号帧。步骤103,对样本信号取绝对值得本文档来自技高网...
音频特征提取方法及装置

【技术保护点】
一种音频特征提取方法,其特征在于,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。

【技术特征摘要】
1.一种音频特征提取方法,其特征在于,所述方法包括:通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,所述M为自然数;按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧;对所述样本信号取绝对值得到正样本信号,将所述正样本信号中对应的能量值最大的信号帧确定为符合预定条件的信号帧,并根据所述符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值;在所述筛选出的信号帧中,将对应的能量值处于所述第二能量区间的信号帧确定为所述音频信号的特征帧。2.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:对所述音频信号进行傅里叶变换,得到音频信号对应的时域信号;按照归一化公式,对所述时域信号进行归一化处理;通过窗长为M的窗函数将归一化处理后的时域信号分为多帧,得到样本信号;其中,所述归一化公式为:其中,所述y(i)为第i个归一化处理后的时域信号,所述x(i)为第i个时域信号帧,xmax为取绝对值后的所述时域信号中,采样值最大的时域信号帧对应的采样值。3.根据权利要求1所述的方法,其特征在于,所述通过窗长为M的窗函数将音频信号分为多帧,得到样本信号,包括:按照窗长为M的窗函数对应的加窗公式,将所述音频信号分为多帧,得到所述样本信号;其中,所述加窗公式为:xw(n)=w(n)*x(n),其中,所述xw(n)为样本信号,所述xw(n)的帧数为L,所述x(n)为所述音频信号,所述w(n)为窗函数,所述n小于且等于N的自然数,所述L=N/M。4.根据权利要求1所述的方法,其特征在于,所述按照预定规则从所述样本信号中选取出两个信号帧,将所述两个信号帧对应的能量值分别确定为第一能量区间的上限值和下限值,并从所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧,包括:计算所述样本信号中每一个信号帧的能量值;按照预定顺序对所述样本信号中的信号帧进行排序,得到信号帧序列;从所述信号帧序列中选取出第个信号帧和第个信号帧,将所述第个信号帧对应的能量值与所述第个信号帧对应的能量值中,能量值大的信号帧对应的能量值确定为所述第一能量区间的上限值,能量值小的信号帧对应的能量值确定为所述第一能量区间的下限值,所述R为正小数;在所述样本信号中筛选出对应的能量值处于所述第一能量区间的信号帧。5.根据权利要求1所述的方法,其特征在于,所述根据所述符合预定条件的信号帧对应的能量值确定第二能量区间,包括:将确定出的信号帧对应的能量值减去第一预值得到第一数值,将所述确定出的信号帧对应的能量值乘以第二预值得到第二数值;在所述第一数值与所述第二数值中,将能量值大的数值确定为所述第二能量区间的上限值,将所述能量值大的数值对应的负值确定为所述第二能量区间的下限值。6.一种音频特征提取装置,其特征在于,所述装置包括:分帧模块,用于通过窗长为M的窗函数将音频信号分为多帧,得到样本...

【专利技术属性】
技术研发人员:赵伟峰
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1