声音判断装置、声音检测装置以及声音判断方法制造方法及图纸

技术编号:4468522 阅读:165 留言:0更新日期:2012-04-11 18:40
噪声除去装置(100)包括:FFT分析部(2402),接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部(101(j)),针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及按照时频区域来判断混合音中所包含的抽出音的频率信号的声音判断装置,尤其涉及对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信号。
技术介绍
第一个以往技术是,从输入语音信号(混合音)中抽出音高周期,在音高周期没有被抽出的情况下,判断为是噪声(例如,参照专利文献1)。在第一个以往技术中,从被判断为语音候补的输入语音中识别语音。 图1是专利文献1所记载的第一以往技术所涉及的噪声除去装置的构成方框图。 该噪声除去装置包括识别部2501、音高抽出部2502、判断部2503、以及周期范围存储部2504。 识别部2501是一处理部,输出语音识别候补,该语音识别候补在被推定为输入语音信号(混合音)中的语音部分(抽出音)的信号区间中。音高抽出部2502是一处理部,从输入语音信号中抽出音高周期。判断部2503是一处理部,根据在识别部2501被输出的针对信号区间的语音识别候补和在音高抽出部2502抽出的该区间中的信号的音高抽出结果,输出语音识别结果。周期范围存储部2504是一存储装置,存储针对由音高抽出部2502抽出的音高周期的周期范围。在该噪声除去装置中,若音高周期在针对预先设定的音高周期的设定周期的范围内的情况下,则判断该信号区间的信号为语音候补,若在针对音高周期的设定周期的范围外的情况下,则判断为噪声。 并且,第二个以往的技术是,根据三个判断单元的判断结果,进行最后的判断,判断是否输入有人的声音(例如,参照专利文献2)。第一判断单元在从输入信号(混合音)中检测到具有谐波结构信号成分的情况下,则判断为人的声音(抽出音)被输入。第二判断单元在输入信号的频率重心在规定的频率范围内的情况下,则判断为人的声音被输出。第三判断单元在针对噪声电平存储单元所存储的噪声电平的输入信号功率比超过了规定的阈值的情况下,则判断为人的声音被输入。 专利文献1日本特开平5-210397号公报(权利要求2、图1) 专利文献2日本特开2006-194959号公报(权利要求1) 在第一个以往技术构成中,音高周期是按照时间区间抽出的。因此,不能按照时频区域来判断混合音中所包含的抽出音的频率信号。并且,不能判断如引擎声音(按照引擎的转动数而音高周期发生变化的声音)等音高周期发生变化的声音。 并且,在第二个以往技术的构成中,根据谐波结构以及频率重心等频谱形状来判断抽出音。为此,若混入了大的噪声,则频谱形状会歪曲,从而不能判断抽出音。尤其是,虽然由于噪声频谱形状消失,而在按照时频区域来看,在抽出音存在一部分的情况下,则不能将此部分的频率信号作为抽出音的频率信号来判断。
技术实现思路
本专利技术的为了解决以往的课题,目的在于提供一种声音判断装置等,其能够按照时频区域来判断混合音中所包含的抽出音的频率信号。尤其是,本专利技术提供的声音判断装置等能够对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信号。 本专利技术的某种局面所涉及的噪声除去装置包括频率分析单元部,接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断单元部,针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod 2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。 通过此构成,在将时刻t的频率信号的相位设为ψ(t)(弧度)时,利用ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)中的距离(表示规定的时间宽度中相位ψ′(t)在时间上的变化的一个指标)。据此,能够按照时频区域对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别。并且,能够判断具有音色的声音(或不具有音色的声音)的频率信号。 最好是,所述抽出音判断部制作多个由第一阈值以上的数量构成的、且频率信号间的所述相位距离在第二阈值以下的所述频率信号的集合,将所述频率信号的集合之间的所述相位距离成为第三阈值以上的每个所述频率信号的集合判断为不同种类的抽出音的频率信号。 通过这种构成,在相同时频区域中存在有多个种类的抽出音的情况下,能够对这些抽出音分别进行区别并判断。例如,能够区别多个车辆的引擎声音,并判断。因此,在将本专利技术的噪声除去装置适用于车辆检测装置的情况下,能够向驾驶者通知存在多个不同的车辆,从而驾驶者能够安全驾驶。并且,由于能够区别多个人的语音并进行判断,因此在将本专利技术的噪声除去装置适用于语音抽出装置的情况下,能够将多个人的语音分离并能够听到。 并且,最好是,所述抽出音判断部从所述规定的时间宽度中所包含的多个时刻的频率信号中,选择1/f的时间间隔的时刻的频率信号,并利用被选择的时刻的频率信号来求所述相位距离,f为分析频率。 通过这种构成,在1/f(f为分析频率)的时间间隔的频率信号中成为ψ′(t)=mod2π(ψ(t)-2πft)=ψ(t),并能够利用ψ(t)来简单地计算求出相位距离。 并且,最好是,上述的声音判断装置进一步包括相位校正部,将时刻t的频率信号的相位ψ(t)校正为ψ′(t)=mod2π(ψ(t)-2πft),相位的单位为弧度,f为分析频率;所述抽出音判断部利用被校正后的所述频率信号的相位ψ′(t)来求所述相位距离。 通过这样的构成,能够进行以ψ′(t)=mod2π(ψ(t)-2πft)来表示的校正。这样,针对比1/f(f为分析频率)的时间间隔更小的时间间隔的频率信号的相位距离,可以利用ψ′(t)以简单地计算来求相位距离。因此,即使在1/f的时间间隔增大的低频带中,也能够按照短时域利用ψ′(t)进行简单地计算,从而判断抽出音。 本专利技术的某种局面所涉及的声音检测装置包括上述的声音判断装置;以及声音检测部,在所述声音判断装置中,当所述混合音的频率信号所包含的频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。 通过这种构成,能够按照时频区域检测抽出音,并通知给利用者。例如,在将本专利技术的噪声除去装置组装到车辆检测装置的情况下,能够检测作为抽出音的引擎声音,并能够向驾驶者通知车辆的接近。 最好是,所述频率分析部接受以每个麦克风所收集的多个所述混合音,并按照每个所述混合音来求频率信号;所述抽出音判断部针对所述混合音的每一个进行所述抽出音的判断;所述声音检测部,在同一时刻,所述混合音的频率信号中所包含的至少一个频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。 通过这种构成,由于噪声的影响,即使从以一个麦克风收集的混合音中检测不到抽出音,也能够从其他的麦克风中检测到抽出音。因此,能够减少检测失误。例如,在将本专利技术的噪声除去装置组装到车辆检测装置的情况下,能够利用通过设置麦克风的本文档来自技高网
...

【技术保护点】
一种声音判断装置,包括: 频率分析部,接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及 抽出音判断部,针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值 以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号; 所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的 相位间距离,相位的单位为弧度,f为分析频率。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:芳泽伸一中藤良久
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1