当前位置: 首页 > 专利查询>索尼公司专利>正文

信号处理装置、信号处理方法和计算机程序制造方法及图纸

技术编号:3971585 阅读:190 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及信号处理装置、信号处理方法和计算机程序。该信号处理装置包括:频率转换处理单元,该频率转换处理单元将输入声音信号中的峰值信号电平超过第一阈值的一部分设置为处理对象信号,并且对该处理对象信号施加频率转换处理,以获取多个带中的各个带的功率电平;以及振幅压缩单元,当在由频率转换处理单元获取的多个带中的各个带的功率电平中存在超过第二阈值的功率电平时,该振幅压缩单元执行振幅压缩处理,否则,禁止执行振幅压缩处理,该振幅压缩处理用于以处理对象信号的峰值信号电平落入在第一阈值内的压缩率压缩该处理对象信号的信号电平。

【技术实现步骤摘要】

本专利技术涉及信息处理装置、信息处理方法和计算机程序,更具体地涉及适合能够 记录和再现更忠实于原始声音的声音的信息处理装置、信息处理方法和计算机程序。
技术介绍
存在记录从传声器(microphone)输入的环境声音的声音记录装置。输入到声音 记录装置的环境声音的振幅范围为大约20dBSPL至130dBSPL。当声音记录装置直接记录 这种振幅信息(环境声音的声音信号)时,需要在声音记录装置上安装具有可适用于该振 幅范围的动态范围的电路。然而,这种电路的成本极高。因此,通常,采用使用AGC(自动增 益控制)电路来限制输入声音信号的振幅的方法(在下文中称为振幅限制方法)。存在当 由于输入声音信号的波形达到该电路的动态范围而导致该波形畸变时对畸变部分(在下 文中称为削波部分(clip portion))的波形进行内插(interpolate)的方法(在下文中称 为波形内插方法)(例如,参见JP-A-60-202576 (专利文献1)和JP-A-53-30257 (专利文献 2))。
技术实现思路
下面说明过去的振幅限制方法。应用过去的振幅限制方法的AGC电路(在下文中 简称为过去的AGC电路)大致被分类成反馈格式(feedback format)(在下文中称为FB格 式)的电路和前馈格式(feed-forward format)(在下文中称为FF格式)的电路。图1是过去的FB格式的AGC电路的实例的视图。图1所示的实例的过去的FB格 式的AGC电路10包括放大器11和检测器电路12。放大器11以预定的增益放大输入声音 信号,并且输出该输入声音信号。被放大器11放大的声音信号被反馈到检测器电路12。检 测器电路12检测放大的声音信号的振幅,并且基于检测结果来改变放大器11的增益。图2是过去的FF格式的AGC电路的实例的视图。图2所示的实例的过去的FF格 式的AGC电路20包括延迟电路21、检测器电路22和放大器23。延迟电路21使输入声音 信号延迟预定的时间,并且将该输入声音信号提供到放大器23。检测器电路22检测输入声 音信号的振幅,并且基于检测结果来改变放大器23的增益。放大器23以由检测器电路22 改变的增益对由延迟电路21延迟并输出的声音信号进行放大,并且输出该声音信号。过去的FB格式和FF格式的AGC电路都可以在输入声音信号的振幅值超过阈值 时降低放大器11或23的增益,以抑制输出声音信号的振幅值。然而,在过去的FB格式的 AGC电路10中,在输入声音信号的振幅值超过阈值之后的一段时间内,以改变之前的增益 放大输入声音信号。因此,在输入声音信号的振幅值超过阈值之后改变增益以前,输出声音 信号的振幅值超过阈值。另一方面,在过去的FF格式的AGC电路20中,在输入声音信号的 振幅值超过阈值之后立即以改变后的增益放大输入声音信号。因此,虽然输入声音信号的振幅值超过阈值,但是输出声音信号的振幅值被限制以落入在阈值内。因此,与过去的FB格式的AGC电路10相比,在过去的FF格式的AGC电路20中提高了波形响应性(waveform responsiveness)。图3是过去的FB格式和FF格式的AGC电路的实例的视图。图3的A是输入声音信号的包络线的实例的视图。图3的B是过去的FB格式的 AGC电路10的输出声音信号的包络线的实例的视图。图3的C是过去的FF格式的AGC电 路20的输出声音信号的包络线的实例的视图。在图3的A中示出的实例中,在从时刻TA到时刻TB的时间段中,输入声音信号的 振幅值超过阈值th。在该时间段中,输入声音信号的波形达到了动态范围d。如图3的B所示,在过去的FB格式的AGC电路10中,相对于在输入声音信号的振 幅值超过阈值th时的时刻TA,在输出声音信号的振幅值被抑制以落入在阈值th内时的时 刻TC延迟了。因此,在从时刻TA到时刻TC的时间段中,输出声音信号的振幅值超过了阈 值th,并且输出声音信号的波形达到了动态范围d。另一方面,如图3的C所示,在过去的FF格式的AGC电路20中,在从时刻ΤΑ,至Ij 时刻ΤΒ’的时间段中,输出声音信号的振幅值被抑制以落入在阈值th内。这样,由此可知, 与过去的FB格式的AGC电路10相比,在过去的FF格式的AGC电路20中提高了波形响应 性。在图3的C中示出的实例中的时刻TA’和TB’中的每一个是从在图3的A中示出的实 例的时刻TA和时刻TB中的每一个起经过在延迟电路21中设置的预定的延迟时间之后的 时刻。然而,不管采用过去的FB格式和FF格式的AGC电路中的哪一个,当在输入声音信 号的振幅值超过阈值th之后又落入到阈值th以下之后立即输出声音信号时,在某一种情 况中,都产生不自然的声音。在图3的A中示出的实例中,在输入声音信号的振幅值落入到阈值th以下时的时 刻是时刻TB。如图3的B中所示,在过去的FB格式的AGC电路10中,输出声音信号的振幅 值在时刻TB基本上下降并然后逐渐地上升。如图3的C中所示,在过去的FF格式的AGC 电路20中,输出声音信号的振幅值在时刻TB’基本上下降并然后逐渐地上升。这种现象, 艮口,振幅值基本上下降并然后逐渐地上升的现象,称为攻击复苏(attack recovery)。因为 从在输入声音信号的振幅值越过阈值th改变时的时刻到根据振幅值的变化改变放大器的 增益为止的响应时间(在下文中称为攻击复苏时间)长,所以出现攻击复苏。因为如果攻 击复苏时间短,则出现其它有害的影响,所以攻击复苏时间被设置得长。图4是用于说明对于攻击复苏时间的输出声音信号的波形的实例的视图。图4的A是输入声音信号的包络线的视图。图4的B是在攻击复苏时间长时获得 的输出声音信号的包络线的视图。图4的C是在攻击复苏时间短时获得的输出声音信号的 包络线的视图。在攻击复苏时间短时,AGC电路在输入声音信号的振幅值越过阈值th时立 即改变放大器的增益。因此,如图4的B中所示,输出声音信号的振幅是均勻化的 (imiformalized)。结果,丢失(lose) 了输入声音信号的包络线信息。与这种输出声音信号相对应的声音是应该原本出现的在音量方面没有任何改变的声音。因此,在某一种情况 中,观看者在听觉(audibility)方面有一种不舒服感。这是在攻击复苏时间短时出现的有害影响。 另一方面,在攻击复苏时间长时,即使输入声音信号的振幅值越过阈值th,也不会 立即改变放大器的增益。因此,如图4的C中所示,保持输入声音信号的包络线信息。因 此,可以形成与输入声音信号的形状接近的输出声音信号的形状。然而,如果攻击复苏时间 被设置得太长,则输入声音信号的振幅值小于阈值th,并且输出声音信号的振幅值保持小。 结果,与输出声音信号相对应的声音的音量保持调低。因此,作为攻击复苏时间,追求和设置最佳时间。这是过去的AGC电路的复杂设计 的原因。在过去的AGC电路中,必须检测输入声音信号的振幅值。振幅值的检测也称为电 平检测。作为过去的电平检测的方法,简单地检测输入声音信号的振幅值的方法(在下文 中称为峰值检测方法)和在时间方向上对输入声音信号的有效值进行积分并检测振幅值 的方法(在下文中称为积分检测方法)是公知的。在应用峰值检测方法时,过去的AGC电 路还对其振幅值瞬时本文档来自技高网...

【技术保护点】
一种信号处理装置,包括:频率转换处理单元,该频率转换处理单元将输入声音信号中的峰值信号电平超过第一阈值的一部分设置为处理对象信号,并且对该处理对象信号施加频率转换处理,以获取多个带中的各个带的功率电平;以及振幅压缩单元,当在由频率转换处理单元获取的多个带中的各个带的功率电平中存在超过第二阈值的功率电平时,该振幅压缩单元执行振幅压缩处理,否则,禁止执行振幅压缩处理,该振幅压缩处理用于以处理对象信号的峰值信号电平落入在第一阈值内的压缩率压缩该处理对象信号的信号电平。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:细见宙史
申请(专利权)人:索尼公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1