一种电力调度系统人员声纹识别鉴权方法、系统及装置制造方法及图纸

技术编号:37820593 阅读:12 留言:0更新日期:2023-06-09 09:55
本发明专利技术提供一种电力调度系统人员声纹识别鉴权方法、系统及装置,该方法包括:用户向电力调度系统发送操作请求和语音信号;剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号;构建声纹识别模型;电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。本发明专利技术能够在受到电流和噪声干扰的情况下准确识别用户语音。准确识别用户语音。准确识别用户语音。

【技术实现步骤摘要】
一种电力调度系统人员声纹识别鉴权方法、系统及装置


[0001]本专利技术涉及人工智能
,特别涉及声纹识别
,尤其涉及一种电力调度系统人员声纹识别鉴权方法、系统及装置。

技术介绍

[0002]在人工智能水平越来越高的今天,更加需要智能化的调度语音处理平台,识别、分析和诊断各类调度语音信息,辅助调度员做出最及时的反应、最精确的判断和最高效的分析。
[0003]时频分析法是声信号处理领域的一种常用手段。但运行中的调度员的声信号不可避免地会受到电流、噪声干扰等的影响,使得不同时间监测到的声波信号亦会随之改变且呈现宽带非平稳特征,其时频特性表现出一定复杂性,难以直接进行分析以区分调度员的不同工作状态。如何提高调度员工作状态识别的准确性是亟待解决的问题。

技术实现思路

[0004]本专利技术的目的是提供一种电力调度系统人员声纹识别鉴权方法、系统及装置,该方法能够在受到电流和噪声干扰的情况下准确识别用户语音。
[0005]一种电力调度系统人员声纹识别鉴权方法,包括:
[0006]用户向电力调度系统发送操作请求和语音信号;
[0007]剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号;
[0008]构建声纹识别模型;
[0009]电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;
[0010]如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。
[0011]剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号,具体为:
[0012]从电力调度系统的输入端获取的第一语音信号,第一语音信号包含了主叫人和被叫人两者的语音;
[0013]在电力调度系统传输线路内部增加的消侧音电路,从主叫人话筒端获取的第二语音,第二语音信号中主叫人语音信号的强度远大于被叫人的语音信号强度;
[0014]对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,将主叫人的语音信号分离出来得到纯净的用户语音信号。
[0015]获取纯净的用户语音信号之后,还包括对纯净的用户语音信号进行预处理,具体为:
[0016]对纯净的用户语音信号进行分帧处理,用窗函数w(n)来乘语音信号s(n),形成加窗语音信号:
[0017]s
w
(n)=s(n)*w(n);
[0018]采用汉明窗减小时间窗两端的坡度,汉明窗的表达式如下:
[0019][0020]不同的a值会产生不同的汉明窗;
[0021]采用预加重对纯净的用户语音信号的高频分量进行提升和去加重对纯净的用户语音信号的低频分量进行压低;
[0022]对纯净的用户语音信号进行端点检测。
[0023]对纯净的用户语音信号进行端点检测包括:
[0024]用短时能量和过零率检测结合的短时过零率检测算法来检测清音,用短时能量来检测浊音;
[0025]根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行纯净的用户语音信号的端点检测。
[0026]根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行纯净的用户语音信号的端点检测包括:
[0027]发清音时,对应的清音激励模型模拟成随机白噪声,使用均值为零,方差为1,并且在时间和幅度值上为白色分布的序列;
[0028]发浊音时,产生间歇的脉冲波,数学表达为:
[0029][0030]上式中,N1为斜三角波上升部分的时间,N2为其下降部分的时间;
[0031]语音信号进行分帧之后,第n帧语音信号xn(m)的能量可表示为:
[0032][0033]短时过零率为一帧语音中语音信号波形穿过横轴即零电平的次数,可表示为:
[0034][0035]其中sgn()为符号函数,通过考察当前采样信号与上一采样信号之间是否出现了波形上符号变化来评估过零次数。
[0036]声纹识别模型由卷积神经网络CNN和长短期记忆网络LSTM网络串联构建而成。
[0037]电力调度系统将收到的用户语音信号和预先录入的声纹信息使用训练好的声纹识别模型进行匹配之前,还包括对声纹识别模型进行训练,具体为:
[0038]将预处理后的多个语音信号分为训练集和测试集;
[0039]将训练集输入声纹识别模型;
[0040]声纹识别模型输出语音信号的匹配结果,若匹配成功输出用户身份,若匹配失败输出无此人员信息;
[0041]迭代训练声纹识别模型至错误率小于预设值。
[0042]电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的
语音信号使用训练好的声纹识别模型进行匹配包括:
[0043]对用户语音信号进行信号提取,以PCM码生成对应WAV文件;
[0044]电力调度系统将对应的WAV文件转发至声纹识别模型;
[0045]取出电力调度系统中具有所述操作的权限的人员预先录入的语音信号和提取的用户语音信号进行信号匹配;
[0046]根据匹配结果判断用户操作权限。
[0047]一种电力调度系统人员声纹识别鉴权系统,包括:
[0048]接收模块,用于接收用户向电力调度系统发送操作请求和语音信号;
[0049]第一数据处理模块,用于构建声纹识别模型;
[0050]第二数据处理模块,用于电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;
[0051]结果输出模块,如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。
[0052]一种电力调度系统人员声纹识别鉴权装置,通过数据传送路径与电力调度系统人员声纹识别鉴权系统相连接,使所述电力调度系统人员声纹识别鉴权装置执行所述的一种电力调度系统人员声纹识别鉴权方法,包括:
[0053]数据获取单元,用于获取用户向电力调度系统发送操作请求和语音信号;
[0054]模型构建单元,用于构建声纹识别模型;
[0055]判断单元,用于电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;
[0056]输出单元,用于输出判断单元的判断结果,如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。
[0057]本专利技术通过用户向电力调度系统发送操作请求和语音信号;剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号;构建声纹识别模型;电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。能够同时从调度电话的输入端和话筒端进行电话语音信号提取,通过电话输入端和话筒端的语音对比,剔除不属于主叫人的语音,提高了对用户语音信号提纯精度,处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力调度系统人员声纹识别鉴权方法,其特征在于,包括:用户向电力调度系统发送操作请求和语音信号;剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号;构建声纹识别模型;电力调度系统将收到的用户语音信号和具有所述操作的权限的人员预先录入的语音信号使用训练好的声纹识别模型进行匹配;如果匹配成功则允许用户进行操作,如果匹配不成功则不允许用户进行操作。2.根据权利要求1所述的一种电力调度系统人员声纹识别鉴权方法,其特征在于,所述剔除用户语音信号中不属于用户语音的成分获取纯净的用户语音信号,具体为:从电力调度系统的输入端获取的第一语音信号,第一语音信号包含了主叫人和被叫人两者的语音;在电力调度系统传输线路内部增加的消侧音电路,从主叫人话筒端获取的第二语音,第二语音信号中主叫人语音信号的强度远大于被叫人的语音信号强度;使用短时过零率、端点检测和语音能量谱对第一语音信号和第二语音信号进行语音信号强度分析与信号比对,将主叫人的语音信号分离出来得到纯净的用户语音信号。3.根据权利要求1所述的一种电力调度系统人员声纹识别鉴权方法,其特征在于,所述获取纯净的用户语音信号之后,还包括对纯净的用户语音信号进行预处理,具体为:对纯净的用户语音信号进行分帧处理,用窗函数w(n)来乘语音信号s(n),形成加窗语音信号:s
w
(n)=s(n)*w(n);采用汉明窗减小时间窗两端的坡度,汉明窗的表达式如下:不同的a值会产生不同的汉明窗;采用预加重对纯净的用户语音信号的高频分量进行提升和去加重对纯净的用户语音信号的低频分量进行压低;对纯净的用户语音信号进行端点检测。4.根据权利要求2所述的一种电力调度系统人员声纹识别鉴权方法,其特征在于,所述对纯净的用户语音信号进行端点检测包括:用短时能量和过零率检测结合的短时过零率检测算法来检测清音,用短时能量来检测浊音;根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行纯净的用户语音信号的端点检测。5.根据权利要求4所述的一种电力调度系统人员声纹识别鉴权方法,其特征在于,所述根据语音信号的浊音和清音选择对应的清音模型和浊音模型进行纯净的用户语音信号的端点检测包括:发清音时,对应的清音激励模型模拟成随机白噪声,使用均值为零,方差为1,并且在时间和幅度值上为白色分布的序列;
发浊音时,产生间歇的脉冲波,数学表达为:上式中,N1为斜三角波上升部分的时间,N2为其下降部分的时间;语音信号进行分帧之后,第n帧语音信号xn(m)的能量可表示为:短...

【专利技术属性】
技术研发人员:张雄威衷宇清崔兆阳凌健文徐武华蒋盛智彭丽文周上罗慕尧骆雅菲刘晨辉孔嘉麟陈文文张思敏周菲吴若迪冯雅雯
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1