【技术实现步骤摘要】
本专利技术涉及一种处理音频信号的方法与装置,且特别涉及一种音频信号的信号提取方法与装置。
技术介绍
一般而言,在进行语音或音乐等音频信号的处理程序时,会保留音频信号中的理想信号,并将噪声从音频信号中移除。理想信号与噪声的分割可分成为噪声检测和信号提取两类方法。噪声检测方法包括下列几种:使用振幅、功率频谱密度(Power Spectral Density,PSD)、过零率(Zero Crossing Rate,ZCR)等的能量检测法;使用机率模型(Probability Model)、频谱特征模型(Spectrum Model)、相似度(Likelihood)等的模型比对法;使用最小均方法(Least Mean Square,LMS)、正规化最小均方法(Normalized Least Mean Square,NLMS)等自动收敛法;使用自适应滤波器(Adaptive Filter)、移动平均(Moving Average)、线性预测编码(Linear Predictive Coding,LPC)等的适应性估计法等。而能量检测法和模型比对法大多在时间轴上区分理想信号和噪声。自动收敛法无法独立出理想信号和噪声的频带来做进一步的分析。而适应性估计法,在信噪比较低时,估计就会失准。另外,使用信号提取的方法,大多属于已知信号类型的判读和辨识,包含频谱图二维遮罩(Spectrogram 2D Masking)、信号模型比对等。此种方法只能提取出期望的信号种类,对于信号种类太多时,相当耗费资源。
技术实现思路
本专利技术提供一种音频信号的信号提取方法与装置,能够快速地提取 ...
【技术保护点】
一种音频信号的信号提取方法,包括:转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列;获得每一上述音频帧的频谱数据;分别以每一上述音频帧作为当前音频帧,依上述时间顺序取出N个上述音频帧各自的上述频谱数据,并且对上述N个音频帧执行频谱相连性运算,包括:基于每一上述N个音频帧所包括的上述频谱数据,获得每一上述N个音频帧的信号区块列表,其中上述信号区块列表用以记录存在有信号值的频谱指数范围;以及依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的频谱相连性;以及将每一上述音频帧与相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号。
【技术特征摘要】
2015.04.30 TW 1041139271.一种音频信号的信号提取方法,包括:转换音频信号为多个音频帧,其中上述多个音频帧依时间顺序排列;获得每一上述音频帧的频谱数据;分别以每一上述音频帧作为当前音频帧,依上述时间顺序取出N个上述音频帧各自的上述频谱数据,并且对上述N个音频帧执行频谱相连性运算,包括:基于每一上述N个音频帧所包括的上述频谱数据,获得每一上述N个音频帧的信号区块列表,其中上述信号区块列表用以记录存在有信号值的频谱指数范围;以及依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的频谱相连性;以及将每一上述音频帧与相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号。2.如权利要求1所述的音频信号的信号提取方法,其中依据每一上述音频帧的上述信号区块列表,寻找每一上述音频帧与其相邻的上述音频帧之间的上述频谱相连性的步骤包括:依据上述N个音频帧各自的上述信号区块列表,依照上述时间顺序由后往前,寻找相邻N个上述音频帧之间的上述频谱相连性,而获得上述N个音频帧各自的第一相连性区块列表,其中上述第一相连性区块列表用以记录依照上述时间顺序由后往前相邻N个上述音频帧之间具有上述频谱相连性的上述频谱指数范围;以及依据上述N个音频帧各自的上述第一相连性区块列表,依照上述时间顺序由前往后,寻找相邻N个上述音频帧之间的上述频谱相连性,而获得上述N个音频帧各自的第二相连性区块列表,其中上述第二相连性区块列表用以记录依照上述时间顺序由前往后相邻的N个上述音频帧之间具有上述频谱相连性的上述频谱指数范围。3.如权利要求2所述的音频信号的信号提取方法,其中依照上述时间顺序由后往前,寻找相邻N个上述音频帧之间的上述频谱相连性的步骤包括:比较第N个上述音频帧与第N-1个上述音频帧两者的上述信号区块列
\t表,而获得上述第N个音频帧与上述第N-1个音频帧各自的上述第一相连性区块列表;以及比较第j个上述音频帧的上述第一相连性区块列表与第j-1个上述音频帧的上述信号区块列表,而获得上述第j-1个音频帧的上述第一相连性区块列表,其中,j为正整数且2≤j≤N-1。4.如权利要求3所述的音频信号的信号提取方法,其中依照上述时间顺序由前往后,寻找相邻N个上述音频帧之间的上述频谱相连性的步骤包括:将上述N个音频帧中的第1个上述音频帧与第2个上述音频帧两者的上述第一相连性区块列表,设定为上述第1个音频帧与上述第2个音频帧各自的上述第二相连性区块列表;以及比较第k个上述音频帧的上述第二相连性区块列表与第k+1个上述音频帧的上述第一相连性区块列表,而获得上述第k+1个音频帧的上述第二相连性区块列表,其中k为正整数且2≤k≤N-1。5.如权利要求2所述的音频信号的信号提取方法,其中在对上述N个音频帧执行上述频谱相连性运算的步骤之后,还包括:依据每一上述音频帧被取出来执行上述频谱相连性运算的次数,将每一次所获得的上述第二相连性区块列表中所记录的上述频谱指数范围进行或逻辑运算,而获得最终相连性区块列表。6.如权利要求5所述的音频信号的信号提取方法,其中将每一上述音频帧中与其相邻上述音频帧之间具有上述频谱相连性的信号判定为理想信号的步骤包括:依据每一上述音频帧的上述最终相连性区块列表中所记录的上述频谱指数范围,以提取每一上述音频帧在频域上的上述频谱数据中,获得具有上述频谱相连性的信号,并将其判定为上述理想信号。7.如权利要求1所述的音频信号的信号提取方法,其中获得每一上述音频帧的上述频谱数据的步骤包括:转换每一上述音频帧为频域信号;对每一上述音频帧的上述频域信号执行短时区背景估计法来获得估计值;以及基于上述估计值,对上述频域信号执行滤除操作,藉以获得每一上述音频帧的上述频谱数据。8.如权利要求7所述的音频信号的信号提取方法,其中获得每一上述音频帧的上述频谱数据的步骤还包括:对每一上述音频帧的上述频域信号执行语音活性检测;以及基于上...
【专利技术属性】
技术研发人员:许宗奇,
申请(专利权)人:智原科技股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。