基于声纹识别的抽水蓄能站检测方法及系统技术方案

技术编号:37482418 阅读:13 留言:0更新日期:2023-05-07 09:22
本公开提供一种基于声纹识别的抽水蓄能站检测方法及系统,包括获取主变压器及水轮机运行的声音信号;对所述声音信号的每一帧通过汉明窗进行处理,再进行傅里叶变换,得到短时平稳信号;提取所述短时平稳信号的短时时域、短时频域,其中,所述短时时域包括短时能量、短时平均过零率、短时能量熵中至少一种,所述短时频域包括Mel频率倒谱系数;对所述短时时域通过基于PCA算法实现多模态特征降维,对所述短时频域通过基于加权优化算法提升所述声音信号的识别率,得到声纹增强特征;通过预先训练的声纹识别模型,识别所述声纹增强特征的类别。别。别。

【技术实现步骤摘要】
基于声纹识别的抽水蓄能站检测方法及系统


[0001]本公开涉及声纹识别
,尤其涉及一种基于声纹识别的抽水蓄能站检测方法及系统。

技术介绍

[0002]长久以来,电力变压器、电抗器与水轮机的声纹信号被当做噪声而忽略了其价值。电力变压器(电抗器)在运行过程中由于磁致伸缩力与电场力的作用,铁芯和绕组会发生机械振动,经过空气介质的传播,产生电力变压器(电抗器)的声信号,包含了设备大量的状态信息。
[0003]当电力变压器(电抗器)发生故障后,内部结构发生变化,会使其声纹信号发生变化,可以通过对声纹信号的分析来对电力变压器(电抗器)进行故障诊断。
[0004]公开于本申请
技术介绍
部分的信息仅仅旨在加深对本申请的一般
技术介绍
的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

[0005]本公开实施例提供一种基于声纹识别的抽水蓄能站检测方法及系统,至少能够解决现有技术中的部分问题。
[0006]本公开实施例的第一方面,
[0007]提供一种基于声纹识别的抽水蓄能站检测方法,包括:
[0008]获取主变压器及水轮机运行的声音信号;
[0009]对所述声音信号的每一帧通过汉明窗进行处理,再进行傅里叶变换,得到短时平稳信号;
[0010]提取所述短时平稳信号的短时时域、短时频域,其中,所述短时时域包括短时能量、短时平均过零率、短时能量熵中至少一种,所述短时频域包括Mel频率倒谱系数;
[0011]对所述短时时域通过基于PCA算法实现多模态特征降维,对所述短时频域通过基于加权优化算法提升所述声音信号的识别率,得到声纹增强特征;
[0012]通过预先训练的声纹识别模型,识别所述声纹增强特征的类别。
[0013]在一种可选的实施方式中,
[0014]对所述短时频域通过基于加权优化算法提升所述声音信号的识别率包括:
[0015]按照如下公式提升所述声音信号的识别率:
[0016][0017]其中,F(k)表示短时频域第k维分量对应的声音信号的识别率,N表示识别对象个数,u
k
(i)表示第i个对象特征向量的第k维分量,u
k
表示均值,x
k
(i)表示第i个识别对象所有样本的第k维分量,n
i
表示第i个识别对象的样本数。
[0018]在一种可选的实施方式中,
[0019]对所述短时时域通过基于PCA算法实现多模态特征降维包括:
[0020]设声纹时域与频域特征向量组成的联合特征向量维数为m,构建一个m*n的矩阵X;
[0021]求取X的相关矩阵R,同时求出R的特征值和特征向量:
[0022][0023]R=X
T
X/(n

1)
[0024]计算R的特征值λ1,λ2,...λ
m
,以及各特征值对应的特征向量u1,u2,...u
m
,确定方差贡献量以及累计方差贡献率,其中,
[0025]方差贡献量:
[0026][0027]方差贡献率:
[0028][0029]选择让累计方差贡献率大于75%的p作为主成分个数,也即降维以后特征向量的维数,实现从m维声纹特征向量到p维特征向量的降维。
[0030]在一种可选的实施方式中,
[0031]所述声纹识别模型基于DNN网络构建,RELU作为激活函数,使用softmax分类函数,目标函数为交叉熵函数,包括四层隐藏层。
[0032]本公开实施例的第二方面,
[0033]提供一种基于声纹识别的抽水蓄能站检测装置,包括:
[0034]第一单元,用于获取主变压器及水轮机运行的声音信号;
[0035]第二单元,用于对所述声音信号的每一帧通过汉明窗进行处理,再进行傅里叶变
换,得到短时平稳信号;
[0036]第三单元,用于提取所述短时平稳信号的短时时域、短时频域,其中,所述短时时域包括短时能量、短时平均过零率、短时能量熵中至少一种,所述短时频域包括Mel频率倒谱系数;
[0037]第四单元,用于对所述短时时域通过基于PCA算法实现多模态特征降维,对所述短时频域通过基于加权优化算法提升所述声音信号的识别率,得到声纹增强特征;
[0038]第五单元,用于通过预先训练的声纹识别模型,识别所述声纹增强特征的类别。
[0039]本公开实施例的第三方面,
[0040]提供一种基于声纹识别的抽水蓄能站检测系统,包括前述所述的基于声纹识别的抽水蓄能站检测装置,还包括:
[0041]基础设施层,包括应用服务器、音频服务器及非结构化存储;
[0042]数据层,包括多传感器声音数据、声音识别模型、标注数据;
[0043]核心组件层,包括声音特征分析组件、存储组件、网络通信组件及接口服务组件;
[0044]声音分析服务层,包括异常工况检测组件、异常工况预警组件、资源库管理组件、存储控制组件。
[0045]在一种可选的实施方式中,
[0046]所述声音特征分析组件包括声音特征提取、智能识别算法、声音流码处理;
[0047]所述存储组件包括分布式组件、存储校验、存储结构组件;
[0048]所述网络通信组件包含数据加解密、请求转发任务调度及数据缓存;
[0049]所述接口服务组件包括接口发布、借口服务、接口状态。
[0050]本公开实施例的第四方面,
[0051]提供一种设备,包括:
[0052]处理器;
[0053]用于存储处理器可执行指令的存储器;
[0054]其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
[0055]本公开实施例的第五方面,
[0056]提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
附图说明
[0057]图1为本公开实施例基于声纹识别的抽水蓄能站检测方法的流程示意图;
[0058]图2为本公开实施例基于声纹识别的抽水蓄能站检测装置的结构示意图。
具体实施方式
[0059]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0060]本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第
四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声纹识别的抽水蓄能站检测方法,其特征在于,包括:获取主变压器及水轮机运行的声音信号;对所述声音信号的每一帧通过汉明窗进行处理,再进行傅里叶变换,得到短时平稳信号;提取所述短时平稳信号的短时时域、短时频域,其中,所述短时时域包括短时能量、短时平均过零率、短时能量熵中至少一种,所述短时频域包括Mel频率倒谱系数;对所述短时时域通过基于PCA算法实现多模态特征降维,对所述短时频域通过基于加权优化算法提升所述声音信号的识别率,得到声纹增强特征;通过预先训练的声纹识别模型,识别所述声纹增强特征的类别。2.根据权利要求1所述的方法,其特征在于,对所述短时频域通过基于加权优化算法提升所述声音信号的识别率包括:按照如下公式提升所述声音信号的识别率:其中,F(k)表示短时频域第k维分量对应的声音信号的识别率,N表示识别对象个数,u
k
(i)表示第i个对象特征向量的第k维分量,u
k
表示均值,x
k
(i)表示第i个识别对象所有样本的第k维分量,n
i
表示第i个识别对象的样本数。3.根据权利要求1所述的方法,其特征在于,对所述短时时域通过基于PCA算法实现多模态特征降维包括:设声纹时域与频域特征向量组成的联合特征向量维数为m,构建一个m*n的矩阵X;求取X的相关矩阵R,同时求出R的特征值和特征向量:R=X
T
X/(n

1)计算R的特征值λ1,λ2,...λ
m
,以及各特征值对应的特征向量u1,u2,...u
m
,确定方差贡献量以及累计方差贡献率,其中,方差贡献量:
方差贡献率:选择让累计方差贡献率大于75%的p作为主成分个数,也即降维以后特征向量的维数,实现从m维声纹特征向量到p维特征向量的降维。4.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:于潇卢彬任刚郭旭东李国宾董旭龙赵雪鹏金清山
申请(专利权)人:河北张河湾蓄能发电有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1