一种应用于电力调度规范性评价的智能语音分析方法技术

技术编号:27882628 阅读:25 留言:0更新日期:2021-03-31 01:28
本发明专利技术涉及语音识别、文本分析技术领域,具体为一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:步骤一:收集电力行业的语言材料;步骤二:对GMM‑HMM模型进行训练;步骤三:语音输入;步骤四:预加重;步骤五:加窗处理;步骤六:提取频域信号;步骤七:得到梅尔频谱;步骤八:输出FBANK特征;步骤九:去除频谱中的毛刺;步骤十:形成基础声学特征;步骤十一:提取动态特征;步骤十二:特征对比;步骤十三:记录说错词汇;步骤十四:特征对比;步骤十五:记录消极词汇;步骤十六:生成评价报告。本发明专利技术可以有效地提高电力调度的质量和效率。

【技术实现步骤摘要】
一种应用于电力调度规范性评价的智能语音分析方法
本专利技术涉及语音识别、文本分析
,具体为一种应用于电力调度规范性评价的智能语音分析方法。
技术介绍
南方电网作为电力服务平台,拥有整体覆盖全网的智能语音引擎开放平台,满足在电力调度领域开展智能语音分析的智能化管理工作需要。在电力调度的沟通过程中,语音信号包含很多信息,比如调度员和现场操作人员的身份信息、性别、和语音内容等。但是,由于工作人员常常用简单的语句来表答一个复杂的问题,很多专业用语都用的不规范,导致双方的沟通不能有效的进行。比如说话人当时情感状态非常着急,普通话不够标准,电力专业词汇发音错误等。鉴于此,为了克服现有技术缺点,提供一种应用于电力调度规范性评价的智能语音分析方法成为本领域亟待解决的问题。
技术实现思路
本专利技术目的在于克服现有技术的缺点,提供一种应用于电力调度规范性评价的智能语音分析方法,可以有效地提高电力调度的质量和效率。为解决以上技术问题,本专利技术提供了一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:步骤一:收集电力行业的语言材料,明确语音语义匹配库需要的数据内容;步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练;步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集;步骤四:对语音信号进行预加重,去除口唇辐射的影响,增加语音的高频分辨率;步骤五:对步骤三得到的语音信号使用汉宁窗进行加窗处理;步骤六:对加窗后的语音信号进行离散傅里叶变换,从每一段加窗后的音频中分别提取出频域信号;步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱;步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征;步骤九:对FBANK特征进行离散余弦变换,把包络与谐波分开,去除频谱中的毛刺;步骤十:在FBANK特征的基础上拼接Pitch特征,形成基础声学特征;步骤十一:采用一阶导数提取动态特征;步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比;步骤十三:记录电力调度过程中说错的电力专业词汇,将进行记录;步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比;步骤十五:记录电力调度过程中的消极词汇进行记录;步骤十六:对话结束后,生成电力调度规范性评价报告。按以上技术方案,所述步骤二中,根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。按以上技术方案,所述步骤四中,对语音信号进行预加重的公式如下:其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。按以上技术方案,所述步骤五中,对语音信号进行加窗的公式如下:其中x[n]是所取窗口内的第n个数,w[n]是与之对应的权重。按以上技术方案,所述步骤六中,提取频域信号的公式如下:其中,X[k]为提取频域信号,exp为指数函数,N为频域抽样点数。按以上技术方案,所述步骤七中,计算得到梅尔频谱的公式如下:其中,wl(k)为对应滤波器的滤波系数,o(l)、c(l)、h(l)为实际频率坐标轴上对应滤波器的下限频率、中心频率和上限频率,fs为采样率,L为滤波器个数,F(l)即为滤波输出。按以上技术方案,所述步骤八中,输出FBANK特征的计算公式如下:其中,Q为FBANK参数的阶数,Si即为所得FBANK参数。按以上技术方案,所述步骤九中,对FBANK特征进行离散余弦变换的公式如下:其中,N为取log之后的特征维度,Ci是得到N维的特征向量,M是离散余弦变换之后的特征维度;离散余弦变换DCT的实质是去除各维信号之间的相关性,将信号映射到低维空间。按以上技术方案,所述步骤十一中,提取动态特征的公式如下:其中,c[t]是第t帧的FBANK+Pitch特征。按以上技术方案,所述步骤十四中,依据步骤二训练好的GMM-HMM模型参数进行参数对齐,并对比识别结果。与现有技术相比,本专利技术提供的应用于电力调度规范性评价的智能语音分析方法,用于构建应用于电力调度规范性评价的智能语音分析系统,可以大大地提高电力调度的质量和效率。附图说明图1为本专利技术实施例的整体流程示意图;图2为本专利技术实施例的电力调度规范性评价报告生成流程示意图;图3为本专利技术实施例的电力调度规范性评价报告结果举例1;图4为本专利技术实施例的电力调度规范性评价报告结果举例2;图5为本专利技术实施例的电力调度规范性评价报告结果举例3;图6为本专利技术实施例的电力调度规范性评价报告结果举例4。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1至图6,本专利技术公开了一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:步骤一:收集电力行业的语言材料(电力行业语料、电力调度规范用语语料),明确语音语义匹配库需要的数据内容。可将电力行业的语言材料的数据分为电力行业语料库、电力调度规范用语语料库。步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练。根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集。步骤四:对语音信号进行进行预加重,去除口唇辐射的影响,增加语音的高频分辨率。其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。步骤五:对步骤三得到的语音信号使用汉宁窗(HanningWindow)进行加窗。其中x[n]是所取窗口内的第n个数,w[n]是与之对应的权重。步骤六:对加窗后的语音信号进行离散傅里叶变换(DFT),从每一段加窗后的音频中分别提取出频域信号。其中,X[k]为提取频域信号,exp为指数函数,N为频域抽样点数。步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱。...

【技术保护点】
1.一种应用于电力调度规范性评价的智能语音分析方法,其特征在于,包括以下步骤:/n步骤一:收集电力行业的语言材料,明确语音语义匹配库需要的数据内容;/n步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练;/n步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集;/n步骤四:对语音信号进行预加重,去除口唇辐射的影响,增加语音的高频分辨率;/n步骤五:对步骤三得到的语音信号使用汉宁窗进行加窗处理;/n步骤六:对加窗后的语音信号进行离散傅里叶变换,从每一段加窗后的音频中分别提取出频域信号;/n步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱;/n步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征;/n步骤九:对FBANK特征进行离散余弦变换,把包络与谐波分开,去除频谱中的毛刺;/n步骤十:在FBANK特征的基础上拼接Pitch特征,形成基础声学特征;/n步骤十一:采用一阶导数提取动态特征;/n步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比;/n步骤十三:记录电力调度过程中说错的电力专业词汇,将进行记录;/n步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比;/n步骤十五:记录电力调度过程中的消极词汇进行记录;/n步骤十六:对话结束后,生成电力调度规范性评价报告。/n...

【技术特征摘要】
1.一种应用于电力调度规范性评价的智能语音分析方法,其特征在于,包括以下步骤:
步骤一:收集电力行业的语言材料,明确语音语义匹配库需要的数据内容;
步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练;
步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集;
步骤四:对语音信号进行预加重,去除口唇辐射的影响,增加语音的高频分辨率;
步骤五:对步骤三得到的语音信号使用汉宁窗进行加窗处理;
步骤六:对加窗后的语音信号进行离散傅里叶变换,从每一段加窗后的音频中分别提取出频域信号;
步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱;
步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征;
步骤九:对FBANK特征进行离散余弦变换,把包络与谐波分开,去除频谱中的毛刺;
步骤十:在FBANK特征的基础上拼接Pitch特征,形成基础声学特征;
步骤十一:采用一阶导数提取动态特征;
步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比;
步骤十三:记录电力调度过程中说错的电力专业词汇,将进行记录;
步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比;
步骤十五:记录电力调度过程中的消极词汇进行记录;
步骤十六:对话结束后,生成电力调度规范性评价报告。


2.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤二中,根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。


3.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤四中,对语音信号进行预加重的公式如下:



其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。


4.根据权利要求1...

【专利技术属性】
技术研发人员:曾时博胡飞飞单政博洪丹轲黄昱张思拓梁寿愚方文崇
申请(专利权)人:中国南方电网有限责任公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1