一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置制造方法及图纸

技术编号:38042719 阅读:13 留言:0更新日期:2023-06-30 11:09
本发明专利技术提供一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置,该方法包括:主叫用户通过电话机向调度员发送操作请求和语音信号;从主叫用户和调度员的混合语音中分离出主叫用户语音信号;对主叫用户语音信号进行降噪;对主叫用户语音信号进行语音增强;电力调度系统将主叫用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;如果匹配成功则允许主叫用户进行操作,如果匹配不成功则不允许主叫用户进行操作。本发明专利技术能够在受到电流和噪声干扰的情况下准确识别用户语音。和噪声干扰的情况下准确识别用户语音。和噪声干扰的情况下准确识别用户语音。

【技术实现步骤摘要】
一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置


[0001]本专利技术涉及人工智能
,特别涉及声纹识别
,尤其涉及一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置。

技术介绍

[0002]在电力调度系统中,电话调度是常见基础形式。当通过电话接收到主叫方的调度指令时,对主叫方进行身份认证并鉴权是提高调度系统安全性和可靠性的一个核心问题。
[0003]通过对做为主叫方的调度申请者的语音信号进行声纹识别是对其进行鉴权的一种可行方法。
[0004]进行相应操作时,会涉及到电话语音的提取,语音信号的预处理,基于语音样本信号的深度神经网络训练和基于主叫方实际调度语音信号的判决与鉴权等一系列流程。
[0005]其中,对电力调度系统人员声纹识别鉴权成功率和可靠性影响很大的一个因素是通过调度电话所提取到的语音信号的质量和干扰问题。
[0006]当电力系统的调度员通过调度电话打入电话时,会不可避免地遇到工作环境内的噪声干扰与电话信道噪声干扰的问题。因此,如何有效地对这两种噪声进行抑制,并有针对性地进行语音增强,是提升系统性能的关键性问题。

技术实现思路

[0007]本专利技术的目的是提供一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置,该方法能够在受到电流和噪声干扰的情况下准确识别用户语音。
[0008]一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,包括:
[0009]主叫用户通过电话机向调度员发送操作请求和语音信号;
[0010]从主叫用户和调度员的混合语音中分离出主叫用户语音信号;
[0011]对主叫用户语音信号进行降噪;
[0012]对主叫用户语音信号进行语音增强;
[0013]电力调度系统将主叫用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;
[0014]如果匹配成功则允许主叫用户进行操作,如果匹配不成功则不允许主叫用户进行操作。
[0015]从主叫用户和调度员的混合语音中分离出主叫用户语音信号包括:
[0016]从电话机端获取的第一语音信号;
[0017]在电力调度系统传输线路内部增加的消侧音电路,从电话机听筒端获取的第二语音信号;
[0018]使用短时过零率、端点检测和语音能量谱对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,分离出主叫用户语音信号;
[0019]分离后获得四个受不同噪声影响的语音信号为:
[0020][0021][0022][0023][0024]对主叫用户语音信号进行降噪包括:
[0025]采用相关特征法对主叫用户语音信号进行降噪:
[0026]假定主叫用户语音信号与主叫用户环境噪声、电话传输信道噪声互不相干,对带噪信号做自相关处理,可得到与不带噪语音信号的自相关帧序列:
[0027][0028]其中s(t)为纯净语音信号,n(t)为噪声信号,w(t)是为达成短时平稳所加的窗函数,R
y
(τ)和R
S
(τ)分别是主叫人语音信号带噪和不带噪的自相关函数;
[0029]采用维纳滤波法对语音信号进行降噪:
[0030]带噪语音信号经过维纳滤波器后的输出s'(t)满足E[|s'(t)

s(t)|2]的值最小,维纳滤波法基于短时平稳语音信号为前提,对于维纳滤波器,得到下式:
[0031][0032]上式中H|ω|为维纳滤波器频域的冲激响应,P
s
(ω),P
n
(ω)分为信号功率谱和噪声功率谱;
[0033]S
O
(ω)=H(ω)
·
Y(ω)
[0034]上式中S
O
(ω)为维纳滤波器的输出信号频谱,Y(ω)为主叫人带噪电话语音信号频谱。
[0035]对主叫用户语音信号进行语音增强包括:
[0036]倒谱均值规整降噪CMN方法清除带非加性噪声主叫人电话语音信号倒谱中的噪声成分,利用CMN方法处理后得到的增强语音倒谱表示为:
[0037][0038]其中为增强语音的倒谱,C
sn
(t)为带噪语音的倒谱,C
s
(t)为纯净语音的倒谱,为主叫人被采集语音段的倒谱平均值。
[0039]使用短时过零率、端点检测和语音能量谱对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,分离出主叫用户语音信号包括:
[0040]用短时能量和过零率检测结合的短时过零率检测算法来检测清音,用短时能量来检测浊音;
[0041]根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行语音信号端点检测从而获取主叫用户语音信号;
[0042]所述根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行语音信号端点检测从而获取主叫用户语音信号包括:
[0043]发清音时,对应的清音激励模型模拟成随机白噪声,使用均值为零,方差为1,并且在时间和幅度值上为白色分布的序列;
[0044]发浊音时,产生间歇的脉冲波,数学表达为:
[0045][0046]上式中,N1为斜三角波上升部分的时间,N2为其下降部分的时间;
[0047]语音信号进行分帧之后,第n帧语音信号xn(m)的能量可表示为:
[0048][0049]短时过零率为一帧语音中语音信号波形穿过横轴即零电平的次数,可表示为:
[0050][0051]其中sgn()为符号函数,通过考察当前采样信号与上一采样信号之间是否出现了波形上符号变化来评估过零次数;
[0052]对主叫用户语音信号进行能量谱估计:
[0053]语音信号进行分帧之后,第n帧语音信号xn(m)的能量表示为:
[0054][0055]采用自相关法提取主叫用户语音信号:
[0056]语音信号xn(m)的短时自相关函数Rn(k)可表示为:
[0057][0058]其中,K为最大的延迟点数,假设语音序列具有周期性,则自相关函数也是同周期的周期函数,对于浊音信号用自相关函数求出语音波形序列的基音周期,噪声信号和含噪语音的自相关函数在峰值幅度有较大差异,根据噪声的大小,设置阈值,确定其端点。
[0059]声纹识别模型由卷积神经网络CNN和长短期记忆网络LSTM网络串联构建而成。
[0060]电力调度系统将收到的用户语音信号和预先录入的声纹信息使用训练好的声纹识别模型进行匹配之前,还包括对声纹识别模型进行训练,具体为:
[0061]将预处理后的多个语音信号分为训练集和测试集;
[0062]将训练集输入声纹识别模型;
[0063]声纹识别模型输出语音信号的判断结果;
[0064]迭代训练声纹识别模型至错误率小于预设值。
[0065]电力调度系统将收到的用户语音信号和具有所述操作的权限的人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,其特征在于,包括:主叫用户通过电话机向调度员发送操作请求和语音信号;从主叫用户和调度员的混合语音中分离出主叫用户语音信号;对主叫用户语音信号进行降噪;对主叫用户语音信号进行语音增强;电力调度系统将主叫用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;如果匹配成功则允许主叫用户进行操作,如果匹配不成功则不允许主叫用户进行操作。2.根据权利要求1所述的一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,其特征在于,所述从主叫用户和调度员的混合语音中分离出主叫用户语音信号包括:从电话机端获取的第一语音信号;在电力调度系统传输线路内部增加的消侧音电路,从电话机听筒端获取的第二语音信号;使用短时过零率、端点检测和语音能量谱对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,分离出主叫用户语音信号;分离后获得四个受不同噪声影响的语音信号为:分离后获得四个受不同噪声影响的语音信号为:分离后获得四个受不同噪声影响的语音信号为:分离后获得四个受不同噪声影响的语音信号为:3.根据权利要求1所述的一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,其特征在于,所述对主叫用户语音信号进行降噪包括:采用相关特征法对主叫用户语音信号进行降噪:假定主叫用户语音信号与主叫用户环境噪声、电话传输信道噪声互不相干,对带噪信号做自相关处理,可得到与不带噪语音信号的自相关帧序列:其中s(t)为纯净语音信号,n(t)为噪声信号,w(t)是为达成短时平稳所加的窗函数,R
y
(τ)和R
S
(τ)分别是主叫人语音信号带噪和不带噪的自相关函数;采用维纳滤波法对语音信号进行降噪:带噪语音信号经过维纳滤波器后的输出s'(t)满足E[|s'(t)

s(t)|2]的值最小,维纳滤波法基于短时平稳语音信号为前提,对于维纳滤波器,得到下式:
上式中H|ω|为维纳滤波器频域的冲激响应,P
s
(ω),P
n
(ω)分为信号功率谱和噪声功率谱;S
O
(ω)=H(ω)
·
Y(ω)上式中S
O
(ω)为维纳滤波器的输出信号频谱,Y(ω)为主叫人带噪电话语音信号频谱。4.根据权利要求1所述的一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,其特征在于,所述对主叫用户语音信号进行语音增强包括:倒谱均值规整降噪CMN方法清除带非加性噪声主叫人电话语音信号倒谱中的噪声成分,利用CMN方法处理后得到的增强语音倒谱表示为:其中为增强语音的倒谱,C
sn
(t)为带噪语音的倒谱,C
s
(t)为纯净语音的倒谱,为主叫人被采集语音段的倒谱平均值。5.根据权利要求2所述的一种电力调度系统人员声纹识别鉴权降噪和语音增强方法,其特征在于,所述使用短时过零率、端点检测和语音能量谱对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,分离出主叫用户语音信号包括:用短时能量和过零率检测结合的短时过零率检测算法来检测清音,用短时能量来检测浊音;根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行语音信号端点检测从而获取主叫用户语音信号;所述根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行语音信号端点检测从而获取主叫用户语音信号包括:发清音...

【专利技术属性】
技术研发人员:崔兆阳衷宇清张雄威凌健文徐武华蒋盛智彭丽文周上罗慕尧骆雅菲刘晨辉孔嘉麟陈文文张思敏周菲吴若迪冯雅雯
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1