声学信号处理装置和声学信号处理方法制造方法及图纸

技术编号:10711162 阅读:118 留言:0更新日期:2014-12-03 16:05
提供一种用于调节起音、余音和噪声成分并且使输出音适合收听者的偏好的声学信号处理装置。该声学信号处理装置包括:FFT部,用于通过将输入音频信号从时域变换成频域来计算频谱信号,并且生成第一振幅谱信号和相位谱信号;起音成分控制器(10),用于通过控制第一振幅谱信号的起音成分来生成第二振幅谱信号;余音成分控制器(20),用于通过控制第一振幅谱信号的余音成分来生成第三振幅谱信号;第一相加部(40),用于通过将第一振幅谱信号、第二振幅谱信号和第三振幅谱信号进行合成来生成第四振幅谱信号;以及IFFT部,用于基于第四振幅谱信号和FFT部所生成的相位谱信号来生成从频域变换成时域的音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及声学信号处理装置和声学信号处理方法,并且更具体地,涉及能够进行所输入的音频信号中的起音(attack sound)或余音(reverberation)的增强/降低处理以及噪声降低处理等的声学信号处理装置和声学信号处理方法。
技术介绍
如今,经常使用数据压缩后的数字音频信号来生成音乐。作为数据压缩后的数字音频信号其中之一,众所周知有MP3(MPEG音频层-3)。MP3是用于使用数字技术来处理声学数据的压缩方法其中之一。如今,MP3广泛用在携带型音乐播放器等中。 诸如MP3等的一般的数字音频信号的问题在于以下:在直接对解压缩后的数字音频信号进行模拟转换以供输出的情况下,起音(起音成分)劣化而使音质受损。为了应对该问题,提出了放大起音的信号输出的数字信号处理装置(例如,参考专利文献1)。 所提出的数字信号处理装置将经由带分割滤波器所提取的预定频带的信号电平与预定阈值电平进行比较,并且将电平等于或高于阈值电平的数字信号检测作为起音。然后,数字信号处理装置放大所检测到的起音,并将放大后的起音与带分割之前的数字信号合成,由此增强起音。 如上所述,可以根据信号电平来放大并增强预定频带中所包括的起音,以使得在例如放大低频起音的情况下,可以增强诸如鼓声等的强力音的动感。在放大高频起音的情况下,可以使诸如钹声等的声音的透明感更强。 如上所述,通过根据信号电平放大并增强起音可能会使输出声音整体变尖锐。因而,所提出的装置可以在起音可能明显劣化的诸如MP3等的压缩后的音频信号的质量方面带来高的改善效果。 现有技术文献 专利文献 专利文献1:日本特开2007-36710
技术实现思路
专利技术要解决的问题 在上述的声学信号处理装置中,基于预定阈值来检测声源中所包括的起音。然而,声源还收录各种振幅电平,由此仅基于阈值难以充分检测到起音。 在包括乐器声和语音这两者的声源中,通过将乐器声和语音合成来表示声源的振幅,由此基于阈值难以将乐器声的起音的信号电平与语音的信号电平区分开。因此,不仅乐器声的起音被不利地放大,而且语音信号也被不利地放大。 此外,乐器声包括波形的上升时的起音和在该起音之后持续的余音(余音成分)。然而,上述的数字信号处理装置仅控制起音,但没有特别控制余音。因此,尽管可以通过放大起音来获得尖锐的输出声音,但存在与余音相比仅尖锐感被过度增强的可能性。 此外,与均匀地放大预定频带的使用例如均衡器的传统放大方法相比,上述的数字信号处理装置可以在S/N比(信噪比)没有降低的情况下增强输出声音。然而,在声源的收录环境中始终存在噪声的情况下、特别是在起音的提取带中包括稳态噪声的情况下,可以增强包括噪声的起音以供合成,这可能导致S/N比大幅降低。 此外,在收听音乐时,音乐对于收听者而言是好是坏在很大程度上依赖于收听者的偏好。因而,一些收听者喜欢尖锐声音,而另一些收听者则认为尖锐声音烦人。一些收听者喜欢包括大量余音成分的声音,而另一些收听者则不喜欢这种声音。一些收听者喜欢包括声源本身中所包含的稳态信号成分(共鸣)或声源的收录环境中所包含的稳态噪声成分作为具有现场感的声音,而另一些收听者则喜欢清晰声音。也就是说,仅通过使用上述的数字信号处理装置放大起音以产生尖锐声音,不容易满足收听者的各种偏好(要求)。 本专利技术是考虑到上述问题而作出的,并且其目的是提供一种声学信号处理装置和声学信号处理方法,其中该声学信号处理装置和声学信号处理方法能够通过调节诸如乐器声等的声源中所包括的起音、在该起音之后持续的余音、以及收录环境中的稳态噪声成分或声源中所包括的稳态信号成分,来产生满足收听者偏好的输出声音。 用于解决问题的方案 根据本专利技术的一种声学信号处理装置,包括:快速傅立叶变换部即FFT部,用于进行以下操作:在时间每次偏移傅立叶变换长度和重叠长度之间的差分时间的情况下对输入音频信号进行短时间傅立叶变换,以计算在时间上彼此相差了所述差分时间的多个振幅谱;针对各频率来计算所计算出的各振幅谱的时间变化,以将所述输入音频信号从时域变换成频域并且计算频谱信号;以及基于所计算出的频谱信号来生成第一振幅谱信号和相位谱信号;起音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的起音成分,以生成第二振幅谱信号;余音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的余音成分,以生成第三振幅谱信号;第一相加部,用于将所述FFT部所生成的所述第一振幅谱信号、所述起音成分控制器所生成的所述第二振幅谱信号和所述余音成分控制器所生成的所述第三振幅谱信号进行合成,以生成第四振幅谱信号;以及逆快速傅立叶变换部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅谱信号和所述FFT部所生成的所述相位谱信号来计算频谱信号,并且对所计算出的频谱信号进行短时间逆傅立叶变换处理和重叠相加,以生成从频域变换成时域的音频信号,其中,所述起音成分控制器包括:第一高通滤波器部即第一HPF部,用于针对各谱,基于预设的第一截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;第一限幅器部,用于对所述第一HPF部进行了高通滤波处理的振幅谱信号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测该振幅谱信号的起音成分;以及第一增益部,用于基于预设的第一加权量来对所述第一限幅器部所检测到的振幅谱信号的起音成分进行加权处理,以及所述余音成分控制器包括:第二高通滤波器部即第二HPF部,用于针对各谱,基于预设的第二截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;振幅反转部,用于将所述第二HPF部进行了高通滤波处理的振幅谱信号乘以-1,以进行振幅反转;第二限幅器部,用于对所述振幅反转部进行了振幅反转的振幅谱信号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测该振幅谱信号的余音成分;以及第二增益部,用于基于预设的第二加权量来对所述第二限幅器部所检测到的振幅谱信号的余音成分进行加权处理。...

【技术保护点】
一种声学信号处理装置,包括:快速傅立叶变换部即FFT部,用于进行以下操作:在时间每次偏移傅立叶变换长度和重叠长度之间的差分时间的情况下对输入音频信号进行短时间傅立叶变换,以计算在时间上彼此相差了所述差分时间的多个振幅谱;针对各频率来计算所计算出的各振幅谱的时间变化,以将所述输入音频信号从时域变换成频域并且计算频谱信号;以及基于所计算出的频谱信号来生成第一振幅谱信号和相位谱信号;起音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的起音成分,以生成第二振幅谱信号;余音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的余音成分,以生成第三振幅谱信号;第一相加部,用于将所述FFT部所生成的所述第一振幅谱信号、所述起音成分控制器所生成的所述第二振幅谱信号和所述余音成分控制器所生成的所述第三振幅谱信号进行合成,以生成第四振幅谱信号;以及逆快速傅立叶变换部即IFFT部,用于基于所述第一相加部所生成的所述第四振幅谱信号和所述FFT部所生成的所述相位谱信号来计算频谱信号,并且对所计算出的频谱信号进行短时间逆傅立叶变换处理和重叠相加,以生成从频域变换成时域的音频信号,其中,所述起音成分控制器包括:第一高通滤波器部即第一HPF部,用于针对各谱,基于预设的第一截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;第一限幅器部,用于对所述第一HPF部进行了高通滤波处理的振幅谱信号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测该振幅谱信号的起音成分;以及第一增益部,用于基于预设的第一加权量来对所述第一限幅器部所检测到的振幅谱信号的起音成分进行加权处理,以及所述余音成分控制器包括:第二高通滤波器部即第二HPF部,用于针对各谱,基于预设的第二截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;振幅反转部,用于将所述第二HPF部进行了高通滤波处理的振幅谱信号乘以‑1,以进行振幅反转;第二限幅器部,用于对所述振幅反转部进行了振幅反转的振幅谱信号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测该振幅谱信号的余音成分;以及第二增益部,用于基于预设的第二加权量来对所述第二限幅器部所检测到的振幅谱信号的余音成分进行加权处理。...

【技术特征摘要】
【国外来华专利技术】2012.03.12 JP 2012-0545601.一种声学信号处理装置,包括:
快速傅立叶变换部即FFT部,用于进行以下操作:在时间每次偏移傅立
叶变换长度和重叠长度之间的差分时间的情况下对输入音频信号进行短时
间傅立叶变换,以计算在时间上彼此相差了所述差分时间的多个振幅谱;针
对各频率来计算所计算出的各振幅谱的时间变化,以将所述输入音频信号从
时域变换成频域并且计算频谱信号;以及基于所计算出的频谱信号来生成第
一振幅谱信号和相位谱信号;
起音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的
起音成分,以生成第二振幅谱信号;
余音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信号的
余音成分,以生成第三振幅谱信号;
第一相加部,用于将所述FFT部所生成的所述第一振幅谱信号、所述起
音成分控制器所生成的所述第二振幅谱信号和所述余音成分控制器所生成
的所述第三振幅谱信号进行合成,以生成第四振幅谱信号;以及
逆快速傅立叶变换部即IFFT部,用于基于所述第一相加部所生成的所述
第四振幅谱信号和所述FFT部所生成的所述相位谱信号来计算频谱信号,并
且对所计算出的频谱信号进行短时间逆傅立叶变换处理和重叠相加,以生成
从频域变换成时域的音频信号,
其中,所述起音成分控制器包括:
第一高通滤波器部即第一HPF部,用于针对各谱,基于预设的第一
截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;
第一限幅器部,用于对所述第一HPF部进行了高通滤波处理的振幅
谱信号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测
该振幅谱信号的起音成分;以及
第一增益部,用于基于预设的第一加权量来对所述第一限幅器部所

\t检测到的振幅谱信号的起音成分进行加权处理,以及
所述余音成分控制器包括:
第二高通滤波器部即第二HPF部,用于针对各谱,基于预设的第二
截止频率来对所述FFT部所生成的所述第一振幅谱信号进行高通滤波处理;
振幅反转部,用于将所述第二HPF部进行了高通滤波处理的振幅谱
信号乘以-1,以进行振幅反转;
第二限幅器部,用于对所述振幅反转部进行了振幅反转的振幅谱信
号的负侧振幅进行限制以将该负侧振幅设置为0,从而针对各谱来检测该振
幅谱信号的余音成分;以及
第二增益部,用于基于预设的第二加权量来对所述第二限幅器部所
检测到的振幅谱信号的余音成分进行加权处理。
2.根据权利要求1所述的声学信号处理装置,其中,还包括噪声控制器,
所述噪声控制器用于对所述第一相加部所生成的所述第四振幅谱信号进行
噪声控制,以生成第五振幅谱信号,
其中,所述IFFT部基于所述噪声控制器所生成的所述第五振幅谱信号和
所述FFT部所生成的所述相位谱信号,来生成从频域变换成时域的音频信号,
以及
所述噪声控制器包括:
第三高通滤波器部即第三HPF部,用于针对各谱,基于预设的第三
截止频率来对所述第一相加部所生成的所述第四振幅谱信号进行高通滤波
处理;
第三限幅器部,用于对所述第三HPF部进行了高通滤波处理的振幅
谱信号的负侧振幅进行限制,以将该负侧振幅设置为0;
第三增益部,用于基于预设的作为0以上且1以下的值的第三加权
量,来对所述第三限幅器部对负侧振幅进行了限制的振幅谱信号进行加权处

\t理;
第四增益部,用于基于通过从值1中减去所述第三加权量的值所获
得的加权量,来对所述第一相加部所生成的所述第四振幅谱信号进行加权处
理;以及
第二相加部,用于将所述第三增益部进行了加权处理的振幅谱信号
和所述第四增益部进行了加权处理的振幅谱信号进行合成,以生成所述第五
振幅谱信号。
3.一种声学信号处理装置的声学信号处理方法,其中在所述声学信号
处理装置中,对输入音频信号进行起音成分控制和余音成分控制,
所述声学信号处理装置包括:
快速傅立叶变换部即FFT部,用于将所述输入音频信号从时域变换
成频域以计算频谱信号,并且生成第一振幅谱信号和相位谱信号;
起音成分控制器,用于控制所述FFT部所生成的所述第一振幅谱信
号的起音成分,以生成第二振幅谱信号;
余音成分控制器,用于控制所述FFT部所生成的...

【专利技术属性】
技术研发人员:桥本武志渡边哲生
申请(专利权)人:歌乐株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利