当前位置: 首页 > 专利查询>索尼公司专利>正文

声音处理装置、声音处理方法及程序制造方法及图纸

技术编号:15343495 阅读:102 留言:0更新日期:2017-05-17 00:28
本技术涉及能够适当地消除噪声的音频处理装置、音频处理方法及程序。一种音频处理装置包括:集声器,该集声器收集音频;音频增强器,该音频增强器使用由集声器收集到的音频信号来增强待提取音频;音频衰减器,该音频衰减器使用由集声器收集到的音频信号来衰减待提取音频;噪声环境估计器,该噪声环境估计器估计周围噪声环境;和后置滤波单元,该后置滤波单元使用来自音频增强器的音频增强信号和来自音频衰减器的音频衰减信号来执行后置滤波处理,其中后置滤波单元根据由噪声环境估计器估计的噪声环境来设定消噪处理强度。本技术可应用于执行音频识别处理的装置,诸如移动电话。

【技术实现步骤摘要】
【国外来华专利技术】声音处理装置、声音处理方法及程序
本技术涉及音频处理装置、音频处理方法及程序。更具体地,本技术涉及可以通过适当地消除噪声来提取期望提取的音频的音频处理装置、音频处理方法及程序。
技术介绍
近来,使用音频的用户界面已经普及。当打电话或搜索信息时,使用音频的用户界面被用在例如移动电话(称为智能手机等的设备)中。然而,如果它在具有许多噪声的环境下使用,那么不能正确地分析由用户产生的音频,并且可能错误地执行处理。因此,专利文献1提出了通过减小噪声的影响来提取期望音频。引文列表专利文献专利文献1:日本专利申请特许公开号2009-49998
技术实现思路
本专利技术所要解决的问题在专利文献1中,设置后置滤波器构件,且该后置滤波器构件被构造为以便执行最大后验(MAP)优化,且反馈回路为了使噪声为零而操作。利用这种构造,如果有例如多点声源噪声(非点声源噪声)或扩散性噪声,那么在输出信号中可以产生音乐噪声。当产生音乐噪声时,引起听觉上的陌生感,此外,音频识别性能劣化。无论噪声类型,诸如点声源噪声、多点声源噪声和扩散性噪声,都期望适当地消除噪声,使得不产生音乐噪声等。本技术鉴于这种情况而提出,且能够适当地消除噪声并提取期望音频。解决问题的方法在本技术的一个方面中的一种音频处理装置包括:集声器,该集声器收集音频;音频增强器,该音频增强器使用由集声器收集到的音频信号来增强待提取音频;音频衰减器,该音频衰减器使用由集声器收集到的音频信号来衰减待提取音频;噪声环境估计器,该噪声环境估计器估计周围噪声环境;和后置滤波单元,该后置滤波单元使用来自音频增强器的音频增强信号和来自音频衰减器的音频衰减信号来执行后置滤波处理,其中该后置滤波单元根据由噪声环境估计器估计的噪声环境来设定消噪处理强度。噪声环境估计器可使用由集声器收集到的音频来估计噪声环境。集声器包括多个麦克风,且噪声环境估计器可计算由所述多个麦克风收集到的信号之间的相关性并将该相关性的值设定为噪声环境的估计结果。噪声环境估计器可使用音频增强信号和音频衰减信号来估计噪声环境。噪声环境估计器可计算音频增强信号的振幅频谱和音频衰减信号的振幅频谱之间的相关性,并将该相关性的值设定为噪声环境的估计结果。噪声环境估计器可根据从外部输入的信息来估计噪声环境。从外部输入的信息可为由用户提供的关于周围噪声环境的信息、位置信息或时间信息中的至少一条信息。该音频处理装置还包括发声区间估计器,该发声区间估计器使用音频增强信号和音频衰减信号来估计发声区间,其中噪声环境估计器可估计在由发声区间估计器估计为非发声区间的区间中的噪声环境。音频增强器可使用加法型波束成形、延迟-求和波束成形或自适应波束成形来产生音频增强信号。音频衰减器可使用减法型波束成形、NULL波束成形或自适应NULL波束成形来产生音频衰减信号。集声器中所包括的麦克风数量以及音频增强器和音频衰减器的输入数量可根据由噪声环境估计器提供的估计结果而改变。所述改变可在启动时或操作期间执行。在本技术的一个方面中的一种音频处理方法包括以下步骤:通过集声器来收集音频;产生音频增强信号,其中使用由集声器收集到的音频信号来增强待提取音频;产生音频衰减信号,其中使用由集声器收集到的音频信号来衰减待提取音频;估计周围噪声环境;以及使用音频增强信号和音频衰减信号来执行后置滤波处理,其中后置滤波处理包括根据估计噪声环境来设定消噪处理强度的步骤。在本技术的一个方面中的一种程序使计算机执行包括以下步骤的处理:通过集声器来收集音频;产生音频增强信号,其中使用由集声器收集到的音频信号来增强待提取音频;产生音频衰减信号,其中使用由集声器收集到的音频信号来衰减待提取音频;估计周围噪声环境;以及使用音频增强信号和音频衰减信号来执行后置滤波处理,其中后置滤波处理包括根据估计噪声环境来设定消噪处理强度的步骤。在本技术的一个方面中的音频处理装置、音频处理方法及程序中,收集音频,产生音频增强信号,其中使用收集到的音频信号来增强待提取音频,产生音频衰减信号,其中使用收集到的音频信号来衰减待提取音频,估计周围噪声环境,以及使用音频增强信号和音频衰减信号来执行后置滤波处理。在后置滤波处理中,根据估计噪声环境来设定消噪处理强度。本专利技术的有益效果如下:根据本技术的一个方面,可以适当地消除噪声并提取期望音频。请注意,效果并不一定限于这里所述的效果,且可为本公开中所述的任何一个效果。附图说明图1为示意图,示出了应用本技术的音频处理装置的实施例的构造。图2为示意图,说明了声源。图3为示意图,示出了第一(a)音频处理装置的内部构造。图4为流程图,说明了第一(a)音频处理装置的操作。图5为流程图,说明了第一(a)音频处理装置的操作。图6为示意图,说明了在时间/频率转换器中的处理。图7为示意图,说明了在音频增强器中的处理。图8为示意图,说明了在音频衰减器中的处理。图9为示意图,说明了在发声区间检测器中的处理。图10为示意图,说明了在噪声环境估计器中的处理。图11为示意图,说明了在后置滤波单元处的校正。图12为示意图,说明了在后置滤波单元处的校正。图13为示意图,说明了在后置滤波单元处的校正。图14为示意图,说明了音频识别率的提高。图15为示意图,示出了第一(b)音频处理装置的内部构造。图16为示意图,说明了噪声环境估计器的构造。图17为流程图,说明了第一(b)音频处理装置的操作。图18为流程图,说明了第一(b)音频处理装置的操作。图19为示意图,示出了第一(c)音频处理装置的内部构造。图20为流程图,说明了第一(c)音频处理装置的操作。图21为流程图,说明了第一(c)音频处理装置的操作。图22为示意图,示出了第二(a)音频处理装置的内部构造。图23为示意图,说明了后置滤波单元的构造。图24为流程图,说明了第二(a)音频处理装置的操作。图25为流程图,说明了第二(a)音频处理装置的操作。图26为流程图,说明了第二(a)音频处理装置的另一个操作。图27为流程图,说明了第二(a)音频处理装置的另一个操作。图28为示意图,示出了第二(b)音频处理装置的内部构造。图29为流程图,说明了第二(b)音频处理装置的操作。图30为流程图,说明了第二(b)音频处理装置的操作。图31为流程图,说明了第二(b)音频处理装置的另一个操作。图32为流程图,说明了第二(b)音频处理装置的另一个操作。图33为示意图,示出了第二(c)音频处理装置的内部构造。图34为流程图,说明了第二(c)音频处理装置的操作。图35为流程图,说明了第二(c)音频处理装置的操作。图36为流程图,说明了第二(c)音频处理装置的另一个操作。图37为流程图,说明了第二(c)音频处理装置的另一个操作。图38为示意图,示出了第三(a)音频处理装置的内部构造。图39为流程图,说明了第三(a)音频处理装置的操作。图40为流程图,说明了第三(a)音频处理装置的操作。图41为流程图,说明了第三(a)音频处理装置的另一个操作。图42为流程图,说明了第三(a)音频处理装置的另一个操作。图43为示意图,示出了第三(b)音频处理装置的内部构造。图44为流程图,说明了第三(b)音频处理装置的操作。图45为流程图,说明了第三(b)音频处理装置的操作。图46为流程图,说明了第三(b)音频本文档来自技高网...
声音处理装置、声音处理方法及程序

【技术保护点】
一种音频处理装置,包括:集声器,被构造为收集音频;音频增强器,被构造为使用由所述集声器收集到的音频信号来增强待提取音频;音频衰减器,被构造为使用由所述集声器收集到的音频信号来衰减所述待提取音频;噪声环境估计器,被构造为估计周围噪声环境;和后置滤波单元,被构造为使用来自所述音频增强器的音频增强信号和来自所述音频衰减器的音频衰减信号来执行后置滤波处理,其中所述后置滤波单元根据由所述噪声环境估计器估计的所述噪声环境来设定消噪处理强度。

【技术特征摘要】
【国外来华专利技术】2014.08.18 JP 2014-1656811.一种音频处理装置,包括:集声器,被构造为收集音频;音频增强器,被构造为使用由所述集声器收集到的音频信号来增强待提取音频;音频衰减器,被构造为使用由所述集声器收集到的音频信号来衰减所述待提取音频;噪声环境估计器,被构造为估计周围噪声环境;和后置滤波单元,被构造为使用来自所述音频增强器的音频增强信号和来自所述音频衰减器的音频衰减信号来执行后置滤波处理,其中所述后置滤波单元根据由所述噪声环境估计器估计的所述噪声环境来设定消噪处理强度。2.根据权利要求1所述的音频处理装置,其中所述噪声环境估计器使用由所述集声器收集到的所述音频来估计所述噪声环境。3.根据权利要求1所述的音频处理装置,其中所述集声器包括多个麦克风,并且所述噪声环境估计器计算由所述多个麦克风收集到的信号之间的相关性并将所述相关性的值设定为所述噪声环境的估计结果。4.根据权利要求1所述的音频处理装置,其中所述噪声环境估计器使用所述音频增强信号和所述音频衰减信号来估计所述噪声环境。5.根据权利要求1所述的音频处理装置,其中计算所述音频增强信号的振幅频谱和所述音频衰减信号的振幅频谱之间的相关性,并将所述相关性的值设定为所述噪声环境的估计结果。6.根据权利要求1所述的音频处理装置,其中所述噪声环境估计器根据从外部输入的信息来估计所述噪声环境。7.根据权利要求6所述的音频处理装置,其中所述从外部输入的信息为由用户提供的关于周围噪声环境的信息、位置信息或时间信息中的至少一条信息。8.根据权利要求1所述的音频处理装置,还包括:发声区间估...

【专利技术属性】
技术研发人员:大迫庆一澁谷崇关矢俊之安部素嗣
申请(专利权)人:索尼公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1