处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统制造方法及图纸

技术编号:11045655 阅读:46 留言:0更新日期:2015-02-18 11:49
一种处理装置估计在声音信号中所包括的噪声的噪声振幅谱。处理装置包括振幅谱计算部分,配置来针对将声音信号划分成时间单元而获得的每个帧来计算声音信号的振幅谱;以及噪声振幅谱估计部分,配置来估计从帧中检测到的噪声的噪声振幅谱。噪声振幅谱估计部分包括第一估计部分,配置来基于由振幅谱计算部分所计算的振幅谱与在检测到噪声之前出现的帧的振幅谱之间的差值,来估计噪声振幅谱,以及第二估计部分,配置来基于衰减函数来估计所述噪声振幅谱,所述衰减函数从检测到所述噪声之后出现的帧的噪声振幅谱获得。

【技术实现步骤摘要】
【国外来华专利技术】处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统
本专利技术涉及处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统。
技术介绍
例如,存在诸如摄影机、数码相机以及IC记录器等之类的电子装置、以及用于经由网络在装置/设备之间发送/接收声音等的并且进行会议的会议系统,其中的每一个均应用从录制的、发送的和/或接收的声音中减少噪声的技术,从而能够清楚地听到声音。作为从输入的声音中减少噪声的方法,抑制噪声的装置等是已知的,例如,通过该装置,利用谱减(spectrumsubtraction)方法,从作为输入的混有噪声的声音中获得噪声被抑制的声音作为输出(例如,见日本特开专利申请第2011-257643号)。根据上述谱减方法,例如可以减少持续产生的噪声,例如来自空调的声音。然而,例如,存在难以减少各种类型的突然产生的噪声的情形,例如由敲击个人计算机键盘所产生的声音、由敲击桌子所产生的声音或者由点击圆珠笔笔尖所产生的声音。
技术实现思路
根据本专利技术的一个方面,估计在声音信号中所包括的噪声的噪声振幅谱的处理装置具有振幅谱计算部分,配置来针对将所述声音信号划分成时间单元而获得的每个帧来计算所述声音信号的振幅谱;以及噪声振幅谱估计部分,配置来估计从所述帧中检测到的噪声的噪声振幅谱。所述噪声振幅谱估计部分包括第一估计部分和第二估计部分。所述第一估计部分配置来基于由所述振幅谱计算部分所计算的振幅谱与在检测到所述噪声之前出现的帧的振幅谱之间的差值,来估计所述噪声振幅谱。所述第二估计部分配置来基于衰减函数来估计所述噪声振幅谱,所述衰减函数从检测到所述噪声之后出现的帧的噪声振幅谱获得。结合附图阅读,通过下面的详细描述,本专利技术的其它目的、特性以及优点将变得更加显著。附图说明图1是示出根据第一实施例的处理装置的功能配置的框图;图2示出了输入至根据第一实施例的处理装置的声音信号;图3示出了根据第一实施例的处理装置的硬件配置;图4是示出根据第一实施例的处理装置的噪声振幅谱估计部分的功能配置的框图;图5示出了在根据第一实施例的处理装置中的噪声振幅谱估计方法;图6示出了在根据第一实施例的处理装置中估计噪声振幅谱的处理的流程图;图7是示出在根据第一实施例的处理装置中的噪声振幅谱估计部分的功能配置的另一示例的框图;图8是示出根据第二实施例的处理系统的功能配置的框图;图9示出了根据第二实施例的处理系统的硬件配置;图10是示出根据第三实施例的处理装置的功能配置的框图;图11示出了根据第三实施例的处理装置的硬件配置;图12是示出根据第三实施例的处理装置的噪声振幅谱估计部分的功能配置的框图;图13示出了在根据第三实施例的处理装置中估计噪声振幅谱的处理的流程图;图14是示出在根据第三实施例的处理装置中的噪声振幅谱估计部分的功能配置的另一示例的框图;图15是示出根据第四实施例的处理系统的功能配置的框图;以及图16示出了根据第四实施例处理系统的硬件配置。具体实施方式下面,将利用附图描述本专利技术的实施例。在各个附图中,相同的参考数字/字母用于相同的元件/组件,并且可省略重复的描述。[第一实施例]<处理装置的功能配置>图1是示出根据第一实施例的处理装置100的功能配置的框图。如图1中所示,处理装置100包括输入端子IN、频率谱转换部分(frequencyspectrumconversionpart)101、噪声检测部分A102、噪声检测部分B103、噪声振幅谱估计部分104、噪声谱减部分(noisespectrumsubtractionpart)105、频率谱逆转换部分106以及输出端子OUT。声音信号输入至处理装置100的输入端子IN。如图2中所示,划分至各个时间单元“u”(例如,每个时间单元“u”是10ms等)的声音信号Sis输入到输入端子IN。注意,在下文中,划分至各个时间单元“u”的声音信号Sis的片段称为“帧”。注意,声音信号Sis是与经由输入设备所输入的声音相对应的信号,所述输入设备例如用于输入声音的麦克风,并且声音信号Sis可以包括除了语音之外的声音。频率谱转换部分101将输入至输入端子IN的声音信号Sis转换为频率谱,并且输出频率谱Sif。频率谱转换部分101例如利用快速傅里叶变换(FFT)将声音信号转换为频率谱。噪声检测部分A102确定所输入的声音信号Sis中是否包括噪声,并且将噪声检测结果输出至噪声振幅谱估计部分104,作为检测信息AIdA。噪声检测部分B103确定从频率谱转换部分101输出的频率谱Sif中是否包括噪声,并且将噪声检测结果输出至噪声振幅谱估计部分104,作为检测信息BIdB。噪声振幅谱估计部分104基于从噪声检测部分A102输出的检测信息AIdA以及从噪声检测部分B103输出的检测信息BIdB,对从频率谱转换部分101所输出的频率谱Sif中所包括的噪声的振幅谱Seno(在下文中,称为“噪声振幅谱”)进行估计。噪声谱减部分105从频率谱转换部分101输出的频率谱Sif中减去从噪声振幅谱估计部分104输出的噪声振幅谱Seno,并且输出其中的噪声已由此得以减少的频率谱Sof。频率谱逆转换部分106将从噪声谱减部分105输出的、其中噪声已由此得以减少了的频率谱Sof转换为声音信号Sos,并且输出所述声音信号Sos。频率谱逆转换部分106例如利用傅里叶逆变换来将频率谱Sof转换为声音信号Sos。输出端子OUT输出从频率谱逆转换部分106输出的、其中噪声已得以由此减少了的声音信号Sos。<处理装置的硬件配置>图3示出了处理装置100的硬件配置。如图3中所示,处理装置100包括控制器110、网络I/F115、记录介质I/F部分116、输入端子IN、以及输出端子OUT。控制器110包括CPU111、HDD(硬盘驱动器)112、ROM(只读存储器)113以及RAM(随机访问存储器)114。CPU111包括算术逻辑单元,将程序和数据从诸如HDD112或ROM113之类的储存设备读取至RAM114中,执行处理,并且由此,实现处理装置100的各个功能。由此,CPU111起到频率谱转换部分101、噪声检测部分A102、噪声检测部分B103、噪声振幅谱估计部分104、噪声谱减部分105、频率谱逆转换部分106(图1中所示)等的作用或其中多个部分的作用。HDD112为存储程序和数据的非易失性性存储设备。所存储的程序和数据包括OS(操作系统)、应用软件等,所述OS为控制整个处理装置100的基础软件,所述应用软件提供关于OS的各种功能。HDD112起到振幅谱存储部分45、噪声振幅谱存储部分46(稍后描述)等的作用。ROM113为非易失性半导体存储器(存储设备),即使在电力供给切断之后,其仍具有存储程序和数据的能力。ROM113存储程序和数据,例如当处理装置100启动时将被执行的BIOS(基本输入/输出系统)、OS设置、网络设置等。RAM114为易失性半导体存储器(存储设备),用于暂时存储程序和数据。网络I/F部分115是外围设备与处理装置100之间的接口,所述外围设备具有通信功能、经由诸如有线和/或无线电路之类的数据传输路径所构建的网络而连接,所述网络例如LAN(局域网)、WAN(广域网)等。记录介质I/F部分11本文档来自技高网...
处理装置、处理方法、程序、计算机可读信息记录介质以及处理系统

【技术保护点】
一种估计在声音信号中所包括的噪声的噪声振幅谱的处理装置,所述处理装置包括:振幅谱计算部分,配置来针对将所述声音信号划分成时间单元而获得的每个帧来计算所述声音信号的振幅谱;以及噪声振幅谱估计部分,配置来估计从所述帧中检测到的噪声的噪声振幅谱,其中所述噪声振幅谱估计部分包括第一估计部分,配置来基于由所述振幅谱计算部分所计算的振幅谱与在检测到所述噪声之前出现的帧的振幅谱之间的差值,来估计所述噪声振幅谱,以及第二估计部分,配置来基于衰减函数来估计所述噪声振幅谱,所述衰减函数从检测到所述噪声之后出现的帧的噪声振幅谱获得。

【技术特征摘要】
【国外来华专利技术】2012.05.01 JP 2012-104573;2013.02.22 JP 2013-032951.一种估计在声音信号中所包括的噪声的噪声振幅谱的处理装置,所述处理装置包括:振幅谱计算部分,配置来针对将所述声音信号划分成时间单元而获得的每个帧来计算所述声音信号的振幅谱;以及噪声振幅谱估计部分,配置来估计从所述帧中检测到的噪声的噪声振幅谱,其中所述噪声振幅谱估计部分包括第一估计部分,配置来基于由所述振幅谱计算部分所计算的振幅谱与在检测到所述噪声之前出现的帧的振幅谱之间的差值,来估计所述噪声振幅谱,以及第二估计部分,配置来基于衰减函数来估计所述噪声振幅谱,所述衰减函数从检测到所述噪声之后出现的帧的噪声振幅谱获得,其中,所述处理装置还包括噪声检测部分,配置来确定所述帧中是否存在所述噪声;以及执行信号输出部分,配置来基于从所述噪声检测部分检测到所述噪声时起所经过的时间,将执行信号输出至所述第一估计部分或所述第二估计部分,以使所述第一估计部分或所述第二估计部分估计所述噪声振幅谱;噪声振幅谱存储部分,配置来存储由所述噪声振幅谱估计部分所估计的所述噪声振幅谱;以及噪声振幅谱存储控制部分,配置来,在所述噪声检测部分检测到所述噪声之后,根据从所述噪声检测部分检测到所述噪声时起所经过的时间,将由所述噪声振幅谱估计部分所估计的所述噪声振幅谱存储在所述噪声振幅谱存储部分中。2.根据权利要求1所述的处理装置,其中由所述第二估计部分所获得的所述衰减函数是指数函数。3.根据权利要求1所述的处理装置,还包括:振幅谱存储部分,配置来存储由所述振幅谱计算部分所计算的所述振幅谱;以及振幅谱存储控制部分,配置来当已检测到所述噪声时,暂时存储由所述振幅谱计算部分所计算的所述振幅谱,并且将暂时所存储的振幅谱存储在所述振幅谱存储部分中。4.根据权利要求1所述的处理装置,还包括:噪声调节部分,配置来调节由所述第一估计部分或所述第二估计部分所估计的所述噪声振幅谱的幅度。5.根据权利要求4所述的处理装置,其中所述噪声调节部分,配置来通过改变将与由所述第一估计部分或所述第二估计部分所估计的所述噪声振幅谱相乘的系数的值来调节所述噪声振幅谱的幅度。6.根据权利要求4所述的处理装置,其中所述噪声调...

【专利技术属性】
技术研发人员:相场亮人鹰见淳一
申请(专利权)人:株式会社理光
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利