音频信号的信号提取方法与装置制造方法及图纸

技术编号:13972049 阅读:57 留言:0更新日期:2016-11-10 21:46
一种音频信号的信号提取方法与装置。转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列。获得各音频帧的频谱数据。依时间顺序取出N个音频帧各自的频谱数据,并且对上述N个音频帧执行频谱相连性运算。最后,将各音频帧中与相邻音频帧之间具有频谱相连性的信号判定为理想信号。

【技术实现步骤摘要】

本专利技术涉及一种处理音频信号的方法与装置,且特别涉及一种音频信号的信号提取方法与装置
技术介绍
一般而言,在进行语音或音乐等音频信号的处理程序时,会保留音频信号中的理想信号,并将噪声从音频信号中移除。理想信号与噪声的分割可分成为噪声检测和信号提取两类方法。噪声检测方法包括下列几种:使用振幅、功率频谱密度(Power Spectral Density,PSD)、过零率(Zero Crossing Rate,ZCR)等的能量检测法;使用机率模型(Probability Model)、频谱特征模型(Spectrum Model)、相似度(Likelihood)等的模型比对法;使用最小均方法(Least Mean Square,LMS)、正规化最小均方法(Normalized Least Mean Square,NLMS)等自动收敛法;使用自适应滤波器(Adaptive Filter)、移动平均(Moving Average)、线性预测编码(Linear Predictive Coding,LPC)等的适应性估计法等。而能量检测法和模型比对法大多在时间轴上区分理想信号和噪声。自动收敛法无法独立出理想信号和噪声的频带来做进一步的分析。而适应性估计法,在信噪比较低时,估计就会失准。另外,使用信号提取的方法,大多属于已知信号类型的判读和辨识,包含频谱图二维遮罩(Spectrogram 2D Masking)、信号模型比对等。此种方法只能提取出期望的信号种类,对于信号种类太多时,相当耗费资源。
技术实现思路
本专利技术提供一种音频信号的信号提取方法与装置,能够快速地提取出音频信号中的理想信号。本专利技术的音频信号的信号提取方法,包括下列步骤。转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列。获得各音频帧的频谱数据。
分别以各音频帧作为当前音频帧,依时间顺序取出N个音频帧各自的频谱数据,并且对N个音频帧执行频谱相连性运算。执行频谱相连性运算的步骤包括:基于N个音频帧各自所包括的频谱数据,获得N个音频帧各自的信号区块列表,其中信号区块列表用以记录存在有信号值的频谱指数范围;以及依据各音频帧的信号区块列表,寻找各音频帧与其相邻的音频帧之间的频谱相连性。最后,将各音频帧中与相邻音频帧之间具有频谱相连性的信号判定为理想信号。本专利技术的一种音频信号的信号提取装置,包括:处理单元以及存储单元。存储单元耦接至处理单元,且包括多个模块。处理单元驱动上述多个模块来检测音频信号中的理想信号。上述多个模块包括:转换模块以及运算模块。转换模块用以转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列。运算模块用以获得各音频帧的频谱数据,并且分别以各音频帧作为当前音频帧,依时间顺序取出N个音频帧各自的频谱数据,并且对N个音频帧执行频谱相连性运算。上述频谱相连性运算包括:基于N个音频帧各自所包括的频谱数据,获得N个音频帧各自的信号区块列表,其中信号区块列表用以记录存在有信号值的频谱指数范围;以及依据各音频帧的信号区块列表,寻找各音频帧与其相邻的音频帧之间的频谱相连性;以及将各音频帧中与相邻音频帧之间具有频谱相连性的信号判定为理想信号。基于上述,藉由执行频谱相连性运算来找出相连的信号区块,藉以排除频谱上小区块孤立的短暂信号,进而可快速区分出理想信号与噪声。为让本专利技术的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。附图说明图1是依照本专利技术一实施例所绘示的一种音频信号的信号提取装置的方块图。图2是依照本专利技术一实施例所绘示的一种分离理想信号及噪声方法的示意图。图3是依照本专利技术一实施例所绘示的一种音频信号的信号提取方法的流程图。图4是依照本专利技术一实施例的相邻两个音频帧的频谱数据的示意图。图5是依照本专利技术一实施例的频谱相连性运算的示意图。【符号说明】100:信号提取装置110:存储单元120:处理单元130:转换模块140:运算模块201:音频成帧模块203:视窗模块205:FFT模块207:绝对值模块211:背景估计模块213:相连性搜寻模块221:VAD模块223:分割模块225:噪声档227:抑制噪声模块229:IFFT模块401~403、411~413:频谱指数范围a、b、n~n+1:音频帧D0~D4:频谱数据SBL0~SBL4:信号区块列表CBL_F0~CBL_F4:第一相连性区块列表CBL_S0~CBL_S4:第二相连性区块列表S310~S340:噪声检测方法各步骤S51~S57:频谱相连性运算各步骤具体实施方式图1是依照本专利技术一实施例所绘示的一种音频信号的信号提取装置的方块图。信号提取装置100包括存储单元110与处理单元120。处理单元120耦接至存储单元110。处理单元120例如为中央处理单元(Central Processing
Unit,CPU)、可编程的微处理器(Microprocessor)、嵌入式控制芯片等。存储单元110例如是任意型式的固定式或可移动式随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、快闪存储器(Flash memory)、硬盘或其他类似装置或这些装置的组合。存储单元110中存储有多个程序代码片段,上述程序代码片段在被安装后,会由处理单元120来执行,以实现音频信号的信号提取方法,藉此快速且准确地提取出音频信号中的理想信号。存储单元110可存储音频信号以及信号提取方法所需的或所产生的各种数值与数据。在此,音频信号例如是将模拟信号格式的原始音频信号经由模拟数字转换后所产生的数字信号。上述的原始音频信号可以是通过麦克风所接收的使用者的语音指令,或是由电视、多媒体播放器等电子装置所发出的信号。所述噪声则例如是背景白噪声或是在特定频率区段具有较强幅度的有色噪声(例如红噪声等)。存储单元110包括转换模块130以及运算模块140。通过处理单元120来驱动存储单元110中的转换模块130以及运算模块140,藉以实现音频信号的信号提取方法。上述转换模块130用以将音频信号转换为多个音频帧(frame),这些音频帧依照时间顺序而排列。运算模块140用以寻找各音频帧与其相邻音频帧之间的频谱相连性,进而将具有频谱相连性的信号判定为理想信号。另外,在其他实施例中,转换模块130以及运算模块140也可以通过处理器来实现。即,利用多个处理器来分别实现转换模块130以及运算模块140的功能。下文列举一例来说明上述信号提取装置100的其中一种应用方式,然而,并不以此来限定其范围。图2是依照本专利技术一实施例所绘示的一种分离理想信号及噪声方法的示意图。在此,理想信号所指为具有频谱相连性的信号。请参照图1及图2,在本实施例中,转换模块130包括音频成帧模块201、视窗模块203、快速傅立叶变换(Fast Fourier Transform,FFT)模块205以及绝对值模块207。运算模块140包括背景估计模块211以及相连性搜寻模块213。音频成帧模块201用以将音频信号转换为多个音频帧。音频成帧模块201将M个采样点集合成一个观测单位,称为音频帧。而为了避免相邻两个音频
帧的变化过大,因此设定两个相邻音频本文档来自技高网
...

【技术保护点】
一种音频信号的信号提取方法,包括:转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列;获得每一上述音频帧的频谱数据;分别以每一上述音频帧作为当前音频帧,依上述时间顺序取出N个上述音频帧各自的上述频谱数据,并且对上述N个音频帧执行频谱相连性运算,包括:基于每一上述N个音频帧所包括的上述频谱数据,获得每一上述N个音频帧的信号区块列表,其中上述信号区块列表用以记录存在有信号值的频谱指数范围;以及依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的频谱相连性;以及将每一上述音频帧与相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号。

【技术特征摘要】
2015.04.30 TW 1041139271.一种音频信号的信号提取方法,包括:转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列;获得每一上述音频帧的频谱数据;分别以每一上述音频帧作为当前音频帧,依上述时间顺序取出N个上述音频帧各自的上述频谱数据,并且对上述N个音频帧执行频谱相连性运算,包括:基于每一上述N个音频帧所包括的上述频谱数据,获得每一上述N个音频帧的信号区块列表,其中上述信号区块列表用以记录存在有信号值的频谱指数范围;以及依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的频谱相连性;以及将每一上述音频帧与相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号。2.如权利要求1所述的音频信号的信号提取方法,其中依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的上述频谱相连性的步骤包括:依据上述N个音频帧各自的上述信号区块列表,依照上述时间顺序由后往前,寻找相邻N个上述音频帧之间的上述频谱相连性,而获得上述N个音频帧各自的第一相连性区块列表,其中上述第一相连性区块列表用以记录依照上述时间顺序由后往前相邻N个上述音频帧之间具有上述频谱相连性的上述频谱指数范围;以及依据上述N个音频帧各自的上述第一相连性区块列表,依照上述时间顺序由前往后,寻找相邻N个上述音频帧之间的上述频谱相连性,而获得上述N个音频帧各自的第二相连性区块列表,其中上述第二相连性区块列表用以记录依照上述时间顺序由前往后相邻的N个上述音频帧之间具有上述频谱相连性的上述频谱指数范围。3.如权利要求2所述的音频信号的信号提取方法,其中依照上述时间顺序由后往前,寻找相邻N个上述音频帧之间的上述频谱相连性的步骤包括:比较第N个上述音频帧与第N-1个上述音频帧两者的上述信号区块列
\t表,而获得上述第N个音频帧与上述第N-1个音频帧各自的上述第一相连性区块列表;以及比较第j个上述音频帧的上述第一相连性区块列表与第j-1个上述音频帧的上述信号区块列表,而获得上述第j-1个音频帧的上述第一相连性区块列表,其中,j为正整数且2≤j≤N-1。4.如权利要求3所述的音频信号的信号提取方法,其中依照上述时间顺序由前往后,寻找相邻N个上述音频帧之间的上述频谱相连性的步骤包括:将上述N个音频帧中的第1个上述音频帧与第2个上述音频帧两者的上述第一相连性区块列表,设定为上述第1个音频帧与上述第2个音频帧各自的上述第二相连性区块列表;以及比较第k个上述音频帧的上述第二相连性区块列表与第k+1个上述音频帧的上述第一相连性区块列表,而获得上述第k+1个音频帧的上述第二相连性区块列表,其中k为正整数且2≤k≤N-1。5.如权利要求2所述的音频信号的信号提取方法,其中在对上述N个音频帧执行上述频谱相连性运算的步骤之后,还包括:依据每一上述音频帧被取出来执行上述频谱相连性运算的次数,将每一次所获得的上述第二相连性区块列表中所记录的上述频谱指数范围进行或逻辑运算,而获得最终相连性区块列表。6.如权利要求5所述的音频信号的信号提取方法,其中将每一上述音频帧中与其相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号的步骤包括:依据每一上述音频帧的上述最终相连性区块列表中所记录的上述频谱指数范围,以提取每一上述音频帧在频域上的上述频谱数据中,获得具有上述频谱相连性的信号,并将其判定为上述理想信号。7.如权利要求1所述的音频信号的信号提取方法,其中获得每一上述音频帧的上述频谱数据的步骤包括:转换每一上述音频帧为频域信号;对每一上述音频帧的上述频域信号执行短时区背景估计法来获得估计值;以及基于上述估计值,对上述频域信号执行滤除操作,藉以获得每一上述音频帧的上述频谱数据。8.如权利要求7所述的音频信号的信号提取方法,其中获得每一上述音频帧的上述频谱数据的步骤还包括:对每一上述音频帧的上述频域信号执行语音活性检测;以及基于上...

【专利技术属性】
技术研发人员:许宗奇
申请(专利权)人:智原科技股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1