一种应用于电力调度领域的语音识别方法及装置制造方法及图纸

技术编号:23100704 阅读:36 留言:0更新日期:2020-01-14 20:54
本发明专利技术实施例提供一种应用于电力调度领域的语音识别方法及装置。包括:将待识别语音的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;将新的特征、功率归一化倒谱系数特征和说话人特征进行拼接,得到混合特征;将混合特征输入至预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对待识别语音特征的后验概率;根据后验概率结合语言模型对待识别语音进行解码,得到识别出的词序列。在电力调度领域提出基于上述三个网络的语音识别声学模型多网络混合训练方法,使得能够通过训练好的模型对待识别语音进行识别,降低调度员的工作强度并缩短其重复性工作的时间。

【技术实现步骤摘要】
一种应用于电力调度领域的语音识别方法及装置
本专利技术涉及电力调度
,尤其涉及一种应用于电力调度领域的语音识别方法及装置。
技术介绍
各级电网调控中心是电网运行的组织、指挥、指导和协调机构,调控中心的调度员作为电网运行的直接指挥者,坚守在电网运行工作的第一线。随着全国联网规模的不断扩大和电压等级的不断提高,电网在设备数量、互联模式、耦合特性、复杂程度等方面已全面超越传统超高压交流电网,电网面临来自自然、人为、内在因素影响的问题也更为突出,并且,由于调控中心的调度员人数众多,因此调控中心不可避免地会出现较多噪音,这就造成调度员调度电网的工作量、复杂度和工作压力日益增大。目前调度运行工作中常规的事务性、例行性、程式化工作占据了调度员大量的时间和精力,使其无法专注于电网运行监视、风险分析和事故处理这些直接关系到电网安全稳定运行的核心任务。因此,急需充分挖掘调度规程、故障预案、调度日志等电网运行文本的基础上,形成电力特有的语音识别声学模型,并通过有效且符合电力调度特征的训练方法对模型进行训练,使得能够通过训练好的模型对电力调度领域中的语音进行识别,降低调度员的工作强度,并缩短调度员重复性工作的时间。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种应用于电力调度领域的语音识别方法及装置。第一方面,本专利技术实施例提供一种应用于电力调度领域的语音识别方法,包括:获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征;将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接,得到混合特征;将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述待识别语音特征的后验概率;根据所述后验概率结合语言模型对所述待识别语音进行解码,得到识别出的词序列;其中,所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的;所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。进一步地,所述卷积神经网络中包括若干个卷积层,所述时间延迟神经网络中包括若干个时间延迟层,所述双向长短期记忆循环神经网络中包括若干个长短期记忆循环层。进一步地,将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,之前还包括:获取电力调度领域的多个语音样本;通过所述多个语音样本对所述预设神经网络模型进行训练。进一步地,获取电力调度领域的多个语音样本,包括:获取电力调度领域的文本材料;对获取到的文本材料进行去重操作;通过多人对去重操作后的文本材料进行阅读录音,得到多声音频率段的电力调度领域的多个语音样本。进一步地,通过所述多个语音样本对所述预设神经网络模型进行训练,包括:对于任意一个语音样本,将所述语音样本的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;将所述新的特征、所述功率归一化倒谱系数特征和所述语音样本的说话人特征进行拼接,得到混合特征;将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述语音样本特征的后验概率;根据所述后验概率结合语言模型对所述语音样本进行解码,得到识别出的词序列;将所述识别出的词序列与所述语音样本输入至损失函数,根据所述损失函数的输出结果对所述预设神经网络模型进行前向反馈或判定所述预设神经网络模型训练完成。第二方面,本专利技术实施例提供一种应用于电力调度领域的语音识别装置,包括:特征获取模块,用于获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征;第一输入模块,用于将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;拼接模块,用于将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接,得到混合特征;第二输入模块,用于将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述待识别语音特征的后验概率;识别模块,用于根据所述后验概率结合语言模型对所述待识别语音进行解码,得到识别出的词序列;其中,所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的;所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。进一步地,还包括:语音样本获取模块,用于获取电力调度领域的多个语音样本;训练模块,用于通过所述多个语音样本对所述预设神经网络模型进行训练。进一步地,语音样本获取模块,包括:文本材料获取单元,用于获取电力调度领域的文本材料;去重单元,用于对获取到的文本材料进行去重操作;语音样本获取单元,用于通过多人对去重操作后的文本材料进行阅读录音,得到多声音频率段的电力调度领域的多个语音样本。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。本专利技术实施例提供的一种应用于电力调度领域的语音识别方法及装置,首次在电力调度领域,提出了基于CNN、BLSTM、TDNN这三个神经网络的语音识别声学模型多网络混合训练方法,在提取特征阶段,选用功率归一化倒谱系数PNCC特征,能够在语音存在噪音的情况下也能很好地进行语音识别,在此基础上使用基于CNN获取时域和频域两个维度的关键信息,通过交替引入TDNN和BLSTM,构建完备的语音识别声学模型多网络混合训练体系,使得能够通过训练好的模型对电力调度领域中的语音进行识别,从而降低调度员的工作强度,并缩短了调度员重复性工作的时间。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种应用于电力调度领域的语音识别方法流程图;图2为本专利技术实施例提供的预设神经网络模型的结构示意图;图3为本专利技术实施例提供的双向长短期记忆循环神经网络的结构示意图;图4为本专利技术实施例提供的一种应用于电力调度领域的语音识别装置的结构示意图;图5为本专利技术实施例提供的一种电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、本文档来自技高网...

【技术保护点】
1.一种应用于电力调度领域的语音识别方法,其特征在于,包括:/n获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征;/n将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;/n将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接,得到混合特征;/n将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述待识别语音特征的后验概率;/n根据所述后验概率结合语言模型对所述待识别语音进行解码,得到识别出的词序列;/n其中,所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的;/n所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。/n

【技术特征摘要】
1.一种应用于电力调度领域的语音识别方法,其特征在于,包括:
获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征;
将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;
将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接,得到混合特征;
将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述待识别语音特征的后验概率;
根据所述后验概率结合语言模型对所述待识别语音进行解码,得到识别出的词序列;
其中,所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的;
所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。


2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络中包括若干个卷积层,所述时间延迟神经网络中包括若干个时间延迟层,所述双向长短期记忆循环神经网络中包括若干个长短期记忆循环层。


3.根据权利要求1所述的方法,其特征在于,将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,之前还包括:
获取电力调度领域的多个语音样本;
通过所述多个语音样本对所述预设神经网络模型进行训练。


4.根据权利要求3所述的方法,其特征在于,获取电力调度领域的多个语音样本,包括:
获取电力调度领域的文本材料;
对获取到的文本材料进行去重操作;
通过多人对去重操作后的文本材料进行阅读录音,得到多声音频率段的电力调度领域的多个语音样本。


5.根据权利要求3所述的方法,其特征在于,通过所述多个语音样本对所述预设神经网络模型进行训练,包括:
对于任意一个语音样本,将所述语音样本的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络,得到新的特征;
将所述新的特征、所述功率归一化倒谱系数特征和所述语音样本的说话人特征进行拼接,得到混合特征;
将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络,得到词序列集合针对所述语音样本特征的后...

【专利技术属性】
技术研发人员:鄢发齐汪旸王春明程迪陈钟钟刘志成徐浩董向明孙涛吴怡菲曲亮金勇
申请(专利权)人:国家电网公司华中分部武汉烽火普天信息技术有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1