音频处理装置以及音频处理方法制造方法及图纸

技术编号:16039829 阅读:27 留言:0更新日期:2017-08-19 21:51
本发明专利技术提供一种音频处理装置以及音频处理方法。所述音频处理装置包括噪声分量提取单元、去除单元和检测单元。所述噪声分量提取单元进行,用于从由与摄像装置相对应的声音拾取装置拾取的声音数据中提取噪声分量的噪声分量提取处理。所述去除单元从声音数据中去除噪声分量。所述检测单元从由摄像装置拍摄的图像中检测摄像对象的状况。所述噪声分量提取单元进行,用于使噪声分量提取处理适应由声音拾取装置拾取的声音数据的学习处理。所述噪声分量提取单元根据由检测单元检测到的摄像对象的状况,改变在学习处理中使噪声分量提取处理适应声音数据的速度。

【技术实现步骤摘要】
音频处理装置以及音频处理方法
所公开的信息涉及一种音频处理装置以及一种音频处理方法。
技术介绍
作为用于消除或减少在音频、视频图像等的信号中包含的噪声的信号处理技术,噪声降低(noisereduction,NR)技术是已知的。一种传统的音频NR技术是被称为频谱减法的方法,该方法通过将作为去除对象的、音频的频率分量减去与各个频率分量的增益相对应的量来将去除对象声音去除。作为NR技术的基本技术,频谱减法是众所周知的。一种通过应用这种技术而开发的NR技术是噪声学习NR。噪声学习NR通过使用自相关或自适应滤波器来自动学习背景声音或持续发生的音频的频率区域和减量(subtractionamount),并且去除其频率分量。例如,日本特开2009-49885号公报中讨论的技术,通过使用自相关函数来计算输入声音中包含的频率特性,并且确定输入声音是音频(语音)还是周围噪声。然后,日本特开2009-49885号公报中讨论的技术计算周围噪声的平均值作为平均噪声,并且从输入声音中减去平均噪声,从而去除周围噪声分量。根据日本特开2009-49885号公报中讨论的技术,从输入声音的频率特性的计算至周围噪声分量的去除的速度(即,噪声学习速度)是恒定的,而与周围噪声无关。然而,周围噪声可能依据一天的时间段等而改变。因此,采用日本特开2009-49885号公报中讨论的技术,无法在周围噪声(噪声环境)的水平依据一天的时间段而改变的环境下实现周围噪声的精确去除。
技术实现思路
在本专利技术中,即使在从音频中去除噪声时噪声环境改变,音频处理装置也能够精确地实施噪声去除。根据本专利技术的一方面,一种音频处理装置包括:噪声分量提取单元,其被构造为进行,用于从由与摄像装置相对应的声音拾取装置拾取的声音数据中提取噪声分量的噪声分量提取处理;去除单元,其被构造为从声音数据中去除噪声分量;以及检测单元,其被构造为从由摄像装置拍摄的图像中检测摄像对象的状况,其中,噪声分量提取单元进行,用于使噪声分量提取处理适应由声音拾取装置拾取的声音数据的学习处理,并且其中,噪声分量提取单元根据由检测单元检测到的摄像对象的状况,改变在学习处理中使噪声分量提取处理适应声音数据的速度。通过以下参照附图对示例性实施例的描述,本专利技术的其他特征将变得清楚。附图说明图1是根据第一实施例的异常监视系统的功能框图。图2是根据第一实施例的在交通现场的背景噪声的音频波形图。图3是例示根据第一实施例的用于检测交通状况的方法的图。图4是例示由根据第一实施例的异常监视系统进行的噪声去除过程的流程图。图5是根据第二实施例的异常监视系统的功能框图。图6是例示根据第二实施例的各个类型的背景噪声的频谱的频谱图。图7是例示由根据第二实施例的异常监视系统进行的噪声去除过程的流程图。图8(由图8A和图8B组成)是例示由根据第三实施例的异常监视系统进行的噪声去除过程的流程图。图9是例示异常监视系统的硬件构造的框图。具体实施例在以下描述中,将参照附图详细描述实施例。下面将描述的实施例仅仅是作为如何实现它们的一个示例,并且将依据应用信息的装置的构造和各种条件而任意地变型或改变。因此,所公开的信息绝不限于以下实施例。当噪声学习速度恒定而无关周围噪声时,在周围噪声(噪声环境)的水平依据一天的时间段等而改变的环境下,无法精确地去除周围噪声。例如,在噪声环境频繁改变的一天的时间段期间,噪声学习可能在一些情况下不能跟随噪声环境的改变,从而导致不能完全去除噪声,除非加快学习速度。另一方面,在噪声环境不改变这么多的一天的时间段期间,不必须加快学习速度。例如,减慢学习速度能够降低除了背景噪声以外的必要的音频可能被无意地学习和去除的可能性。在实施例中,将鉴于这一点来描述能够以高精度实施噪声去除的噪声去除装置。此外,还将描述包括这种噪声去除装置的监视系统。换句话说,能够以以下方式来定义各个实施例中的学习速度。具体而言,学习速度意指用于从由声音拾取装置拾取的声音数据中提取噪声分量的自适应滤波器的滤波器系数适应当前声音数据的速度。此外,用于学习噪声的处理也可以被称为噪声剖析(noiseprofiling)。<异常监视系统的概述>将参照图1至图4描述包括根据第一实施例的噪声去除装置的异常监视系统。噪声去除装置是通过噪声去除来处理音频的装置,因此能够被称为音频处理装置。首先,将参照图1中所示的异常监视系统100的框图(功能构造图),来描述异常监视系统100的功能构造。根据本实施例的异常监视系统100是监视在摄像现场(预定摄像范围)的交通状况的异常(交通异常)的系统。异常监视系统100连接到外部的监控监视器装置50。如果在摄像现场发生了碰撞声、玻璃破碎声或爆炸声等,则异常监视系统100检测这种冲击声音等作为异常声音(特定声音),并且向监控监视器装置50发出事件通知(向监控监视器装置50通知异常声音的发生)。在各个实施例中,假设噪声是除作为检测对象的声音(在各个实施例中为异常声音)以外的背景声音。在以下描述中,背景声音也可以被称为背景噪声。异常监视系统100是监视可能发生背景噪声的交通状况的系统,因此包括用于去除持续发生的背景噪声的机构(噪声去除功能或噪声去除装置)以允许以更高的精度来检测异常声音。异常监视系统100包括音频输入装置1、视频输入装置2、通信单元3以及信息处理单元4。异常监视系统100经由通信单元3连接到监控监视器装置50。音频输入装置1获取摄像现场的音频,并且将该音频输入到信息处理单元4。音频输入装置1例如是诸如麦克风等的声音拾取装置。视频输入装置2例如是能够拍摄(摄像)运动图像的照相机装置。视频输入装置2对预定摄像范围进行摄像,并且生成视频数据。能够从视频数据获取摄像范围的状况(在本实施例中为交通状况)。音频输入装置1是与拍摄视频数据的摄像装置相对应的声音拾取装置。该声音拾取装置不一定必须配设在摄像装置内部,并且可以配设在摄像装置外部。此外,声音拾取装置不一定必须是仅拾取在朝向由摄像装置摄像的摄像范围的方向上的声音的装置。例如,声音拾取装置可以是通过使用具有宽方向性的麦克风来拾取摄像装置周围(包括朝向摄像范围的方向)的声音的装置。所公开的信息还能够应用到这样的用途:系统从由声音拾取装置拾取的声音中检测诸如尖叫声等的异常声音,并且使摄像装置指向该异常声音。信息处理单元4包括视频信息处理单元5、音频信息处理单元6、异常声音检测处理单元7、计时器单元8以及事件通知单元9。由视频信息处理单元5和音频信息处理单元6实施噪声去除功能,由此包括在根据本实施例的异常监视系统100中的噪声去除装置包括视频信息处理单元5和音频信息处理单元6。视频信息处理单元5接收视频输入装置2的输出信号(来自视频输入装置2的输入视频图像)和计时器单元8的输出信号,对输入视频图像进行视频处理,并且将处理后的信号(视频图像)发送到音频信息处理单元6。音频信息处理单元6接收音频输入装置1的输出信号(来自音频输入装置1的输入音频)和视频信息处理单元5的输出信号,并且对输入音频实施噪声去除处理。经受噪声去除的音频(音频信息处理单元6的输出信号)被发送到异常声音检测处理单元7。异常声音检测处理单元7接收音频信息处理单元6的输出信号,并且检测和处理异常声音。由该处本文档来自技高网...
音频处理装置以及音频处理方法

【技术保护点】
一种音频处理装置,所述音频处理装置包括:噪声分量提取单元,其被构造为进行,用于从由与摄像装置相对应的声音拾取装置拾取的声音数据中提取噪声分量的噪声分量提取处理;去除单元,其被构造为从声音数据中去除噪声分量;以及检测单元,其被构造为从由摄像装置拍摄的图像中检测摄像对象的状况,其中,噪声分量提取单元进行,用于使噪声分量提取处理适应由声音拾取装置拾取的声音数据的学习处理,并且其中,噪声分量提取单元根据由检测单元检测到的摄像对象的状况,改变在学习处理中使噪声分量提取处理适应声音数据的速度。

【技术特征摘要】
2016.02.02 JP 2016-0184171.一种音频处理装置,所述音频处理装置包括:噪声分量提取单元,其被构造为进行,用于从由与摄像装置相对应的声音拾取装置拾取的声音数据中提取噪声分量的噪声分量提取处理;去除单元,其被构造为从声音数据中去除噪声分量;以及检测单元,其被构造为从由摄像装置拍摄的图像中检测摄像对象的状况,其中,噪声分量提取单元进行,用于使噪声分量提取处理适应由声音拾取装置拾取的声音数据的学习处理,并且其中,噪声分量提取单元根据由检测单元检测到的摄像对象的状况,改变在学习处理中使噪声分量提取处理适应声音数据的速度。2.根据权利要求1所述的音频处理装置,其中,在图像中包含的特定对象的数量增大到大于预定阈值的情况下,检测单元确定所述状况改变,并且其中,在检测单元确定摄像对象的状况改变的情况下,噪声分量提取单元采用高速作为在学习处理中使噪声分量提取处理适应声音数据的速度。3.根据权利要求1所述的音频处理装置,其中,在图像中包含的特定对象的速度增大到高于预定阈值的情况下,检测单元确定所述状况改变,并且其中,在检测单元确定摄像对象的状况改变的情况下,噪声分量提取单元采用高速作为在学习处理中使噪声分量提取处理适应声音数据的速度。4.根据权利要求1所述的音频处理装置,其中,噪声分量提取单元通过对声音数据进行使用自适应滤波器的处理来提取噪声分量,并且其中,噪声分量提取单元通过根据摄像对象的状况改变自适应滤波器的系数,来改变在学习处理中使噪声分量提取处理适应声音数据的速度。5.根据权利要求1所述的音频处理装置,其中,在所述状况针对预定时间段没有改变的情况下,噪声分量提取单元采用低速作为在学习处理中使噪声分量提取处理适应声音数据的速度。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:黑木智彦
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1