异常音检测装置、异常度计算装置、异常音生成装置、异常音检测学习装置、异常信号检测装置、异常信号检测学习装置、及它们的方法以及程序制造方法及图纸

技术编号:22334354 阅读:37 留言:0更新日期:2019-10-19 13:05
提供与有无异常音的学习数据无关、可以生成用于异常音检测的特征量提取函数的异常音检测学习技术。异常音检测学习装置包括:根据变分自动编码器的最佳化指标,更新输入的特征量提取函数以及特征量逆变换函数的第一函数更新单元(3);根据正常音的学习数据提取正常音的音响特征量的音响特征量提取单元(4);使用提取的音响特征量更新正常音模型的正常音模型更新单元(5);使用正常音的学习数据以及输入的特征量提取函数,求与作为规定的值的伪阳性率ρ对应的阈值

【技术实现步骤摘要】
【国外来华专利技术】异常音检测装置、异常度计算装置、异常音生成装置、异常音检测学习装置、异常信号检测装置、异常信号检测学习装置、及它们的方法以及程序
本专利技术涉及用于由音响信号等信号进行异常音等的异常波检测的学习技术。
技术介绍
设置在工厂等中的大型制造设备、成型设备等商业用设备,仅由于故障而运转停止,对商业带来很大麻烦。因此,需要日常性地监视其动作状况,在异常发生后马上进行应对。作为解决方案,有商业用设备的管理业者定期向现场派遣维修员,确认部件的磨损等的方法。但是,因为花费大量人工费和移动费、劳力,所以难以在全部商业用设备或工厂中实施该方法。作为其解决手段,有在机械内部设置麦克风,日常性地监视其动作音的方法。分析其动作音,在发生了被认为是异常的声音(即,异常音)后对其探测,通过发出警报来解决它。但是,在对每个机械的种类或每个个体,设定异常音的种类或其检测方法中,比人工监视更花费成本。因此,需要自动设计以自动方式探测异常音的规则。作为解决该问题的方法,已知基于统计的方法的异常音探测(例如,参照非专利文献1。)。基于统计的方法的异常音探测大致分为有教师异常音探测和无教师异常音探测。在有教师异常音探测中,由正常音和异常音的学习数据学习识别器,相对于此,在无教师异常音探测中,仅由正常音的学习数据学习识别器。在产业的应用中,因为收集异常音的学习数据很困难,所以在多数情况下,采用无教师异常音探测。无教师异常音探测的学习/探测流程如图7所示。在学习中,提取由正常动作时的音数据(学习数据)得到的音响特征量。之后,由该音响特征量学习正常音模型(概率密度函数)。然后,在判定中,对于新得到的观测,提取音响特征量,以学习完的正常音模型评价负的对数似然(即,异常度)。若该值小于阈值,则判断为正常,若大于阈值则判断为异常。这即为评价观测音的正常音模型的符合的良好度。这基于以下的考虑方法,即,若观测为正常音,则应为发出与正常音的学习数据“相似的”音,若为异常,则应为发出与正常音的学习数据“不相似的”音。为了使图7更具体化,用算式进行说明。异常音探测的问题是判定观测信号Xω,τ∈CΩ×T正常还是异常的问题。其中,ω∈{1,...,Ω}和τ∈{1,...,T}分别是频率和时间的索引。首先,最初从观测信号提取音响特征量fτ∈RD。fτ=F(xτ)(1)其中,F是特征量提取函数。并且xτ是将音响特征量的提取所需要的Xω,τ排列后的向量,例如以下那样设定。Xτ=(X1,τ,X2,τ,...,XΩ,τ)(3)其中,T表示转置,Pb,Pf分别表示xτ中包含的过去和未来的帧数。例如,被设定为Pb=Pf=5左右。接着,如以下那样计算异常度L(fτ)。L(fτ)=-lnp(fτ|z=0)(4)其中,p(fτ|z=0)是正常音模型。而且,z是若Xω,τ为正常音则z=0,若为异常音则z≠0的指示符。最后,若L(fτ)的值大于阈值则判定为异常,若小于阈值则判定为正常。其中,是异常判定函数。现有技术文献非专利文献非专利文献1:井出剛,杉山将,“異常検知と変化検知,”講談社,pp.6-7,2015.
技术实现思路
专利技术要解决的课题在无教师异常探测中成为问题的是特征量提取函数F(·)的设计。在有教师异常音探测中,由人工设计可良好地识别判别对象的音响特征量。例如若得知正常音为1000Hz的正弦波,异常音为2000Hz的正弦波,则由于音色不同,所以对每帧提取梅尔滤波器组(Melfilterbank)的对数功率(log-MFBO)。若正常音是不变的发动机音,异常音是设备之间“咯噔”碰撞那样的音,则由于异常音为突发的音,使用提取梅尔滤波器组的功率的时间差分(ΔMFBO)。而且,在作为有教师学习之一的“深层学习”中,也可以说可根据学习数据自动设计音响特征量。但是,在无教师异常探测中,不知道发生具有哪样的音的特性的异常音。所以难以通过人工设计特征量提取函数,而且也难以使用深层学习。例如,由于正常音为1000Hz的正弦波,所以若异常音假定为2000Hz的正弦波,并将log-MFBO设为音响特征量,则不能检测设备之间“咯噔”碰撞那样的异常音。而且,反之亦然。因此,只能使用作为通用的音响特征量的梅尔滤波器组倒谱系数(MFCC)等,与有教师学习相比检测精度较差。本专利技术的目的是提供与有无异常信号的学习数据无关,可生成用于异常信号检测的特征量提取函数的异常音检测学习装置、使用了该特征量提取函数的异常音检测装置、异常度计算装置、异常音生成装置、异常音检测学习装置、异常信号检测装置、异常信号检测学习装置、这些装置的方法以及程序。用于解决课题的手段本专利技术的一个方式的异常音检测装置是检测输入的输入音是否为异常音的异常音检测装置,包括:使用特征量提取函数提取输入音的音响特征量的音响特征量提取单元;使用提取的音响特征量计算输入音的异常度的异常度计算单元;根据得到的异常度和阈值判定输入音是否为异常音的判定单元,特征量提取函数基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、以及将输入的异常音模型化后的概率分布,使用由正常音得到的异常度设定阈值。本专利技术的一个方式的异常度计算装置是为了检测输入的输入音是否为异常音,计算输入音的异常度的异常度计算装置,包括:使用特征量提取函数提取输入音的音响特征量的音响特征量提取单元;使用提取的音响特征量计算输入音的异常度的异常度计算单元,特征量提取函数基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、以及将输入的异常音模型化后的概率分布,使用从正常音得到的异常度设定阈值。本专利技术的一个方式的异常音生成装置是根据可包含正常音以及异常音的声音,生成异常音的异常音生成装置,包括:使用将可包含正常音以及异常音的声音模型化后的概率分布、作为特征量提取函数的逆函数的特征量逆变换函数、以及阈值来生成异常音的异常音生成单元;特征量逆变换函数是基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、将输入的异常音模型化后的概率分布的特征量变换函数的逆变换函数,使用从正常音得到的异常度设定阈值。本专利技术的一个方式的异常音检测学习装置包括:根据变分自动编码器的最佳化指标,更新输入的特征量提取函数以及特征量逆变换函数的第一函数更新单元;使用输入的特征量提取函数,根据正常音的学习数据提取正常音的音响特征量的音响特征量提取单元;使用提取的音响特征量更新正常音模型的正常音模型更新单元;使用正常音的学习数据以及输入的特征量提取函数,求与作为规定的值的伪阳性率ρ对应的阈值的阈值更新单元;以及使用提取的正常音的音响特征量以及输入的异常音的音响特征量,根据由求出的阈值决定的内曼皮尔森型最佳化指标,将更新的特征量提取函数更新的第二函数更新单元,反复进行将由第二函数更新单元更新的特征量提取函数设为输入的、第一函数更新单元、音响特征量提取单元、正常音模型更新单元以及第二函数更新单元的处理。本专利技术的一个方式的异常信号检测装置是检测输入的输入信号是否为异常信号的异常信号检测装置,包括:使用特征量提取函数提取输入信号的特征量的特征量提取单元;使用提取的特征量计算输入信号的异常度的异常度计算单元;以及根据得到的异常度和阈值,判定输入信号是否为异常本文档来自技高网
...

【技术保护点】
1.一种异常音检测装置,检测输入的输入音是否为异常音,包括:音响特征量提取单元,使用特征量提取函数提取所述输入音的音响特征量;异常度计算单元,使用提取的所述音响特征量计算所述输入音的异常度;以及判定单元,根据得到的所述异常度和阈值,判定所述输入音是否为异常音,所述特征量提取函数基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、以及将输入的异常音模型化后的概率分布,使用从所述正常音得到的异常度设定所述阈值。

【技术特征摘要】
【国外来华专利技术】2017.02.15 JP 2017-0258651.一种异常音检测装置,检测输入的输入音是否为异常音,包括:音响特征量提取单元,使用特征量提取函数提取所述输入音的音响特征量;异常度计算单元,使用提取的所述音响特征量计算所述输入音的异常度;以及判定单元,根据得到的所述异常度和阈值,判定所述输入音是否为异常音,所述特征量提取函数基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、以及将输入的异常音模型化后的概率分布,使用从所述正常音得到的异常度设定所述阈值。2.如权利要求1所述的异常音检测装置,设定所述特征量提取函数,使得从使用所述特征量提取函数得到的正常音的音响特征量计算的异常度小于所述阈值、且从使用所述特征量提取函数得到的被输入的所述异常音的音响特征量计算的异常度大于所述阈值。3.如权利要求2所述的异常音检测装置,所述特征量提取函数是,通过基于变分自动编码器的最佳化指标的第1更新,以及基于所述正常音的音响特征量、所述异常音的音响特征量、由所述阈值决定的指标的第2更新而生成的函数。4.如权利要求3所述的异常音检测装置,所述指标是内曼皮尔森型最佳化指标。5.如权利要求1所述的异常音检测装置,将所述异常音模型化后的概率分布是,从将可包含所述正常音以及异常音的声音模型化后的概率分布中除去了将所述正常音模型化后的概率分布的概率分布。6.如权利要求1所述的异常音检测装置,输入的所述异常音是,使用将可包含所述正常音以及异常音的声音模型化后的概率分布、作为所述特征量提取函数的逆函数的特征量逆变换函数、以及所述阈值而生成的声音。7.如权利要求6所述的异常音检测装置,将p(F(x))设为将可包含所述正常音以及异常音的声音模型化后的概率分布,将p(F(x)|z=0)设为将所述正常音模型化后的概率分布,输入的所述异常音是,通过生成按照以下的式(23)的音响特征量fks而生成的声音,8.如权利要求1至7的任意一项所述的异常音检测装置,将N设为规定的正整数,所述阈值是,在将从所述正常音得到的异常度降序分类时的从上开始第N个异常度。9.一种异常度计算装置,为了检测输入的输入音是否为异常音,计算所述输入音的异常度,包括:音响特征量提取单元,使用特征量提取函数提取所述输入音的音响特征量;以及异常度计算单元,使用提取的所述音响特征量,计算所述输入音的异常度,所述特征量提取函数基于将可包含正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、以及将输入的异常音模型化后的概率分布,使用从所述正常音得到的异常度设定所述阈值。10.一种异常音生成装置,根据可包含正常音以及异常音的声音,生成异常音,包括:异常音生成单元,使用将可包含所述正常音以及异常音的声音模型化后的概率分布、作为所述特征量提取函数的逆函数的特征量逆变换函数、以及阈值,生成异常音,所述特征量逆变换函数是,基于将可包含所述正常音以及异常音的声音模型化后的概率分布、将正常音模型化后的概率分布、将输入的异常音模型化后的概率分布的特征量变换函数的逆变换函数,使用从所述正常音得到的异常度设定所述阈值。11.如权利要求10所述的异常音生成装置,所述异常音生成单元生成近似了遵从将可包含所述正常音以及异常音的声音模型化后的概率分布的音响特征量的值,计算生成的值的异常度,在计算出的异常度大于所述阈值的情况下,通过计算将生成的值输入到所述特征量逆变换函数时的输出值,生成所述异常音。12.一种异常音检测学习装置,包括:第一函数更新单元,根据变分自动编码器的最佳化指标,更新输入的特征量提取函数以及特征量逆变换函数;音响特征量提取单元,使用输入的所述特征量提取函数,根据正常音的学习数据提取正常音的音响特征量;正常音模型更新单元,使用提取的所述音响特征量更新正常音模型;阈值更新单元,使用所述正常音的学习数据以及输入的所述特征量提取函数,求与作为规定的值的伪阳性率ρ对应的阈值以及第二函数更新单元,使用提取的所述正常音的音响特征量以及输入的异常音的音响特征量,根据由求出的所述阈值决定的内曼皮尔森型最佳化指标将更新的所述特征量提取函数更新,反复进行将由所述第二函数更新单元更新的特征量提取函数设为输入的、所述第一函数更新单...

【专利技术属性】
技术研发人员:小泉悠马齐藤翔一郎植松尚
申请(专利权)人:日本电信电话株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1