一种应用于电力调度领域的语音识别方法及装置制造方法及图纸

技术编号：23100704 阅读：36 留言：0更新日期：2020-01-14 20:54

本发明专利技术实施例提供一种应用于电力调度领域的语音识别方法及装置。包括：将待识别语音的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络，得到新的特征；将新的特征、功率归一化倒谱系数特征和说话人特征进行拼接，得到混合特征；将混合特征输入至预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络，得到词序列集合针对待识别语音特征的后验概率；根据后验概率结合语言模型对待识别语音进行解码，得到识别出的词序列。在电力调度领域提出基于上述三个网络的语音识别声学模型多网络混合训练方法，使得能够通过训练好的模型对待识别语音进行识别，降低调度员的工作强度并缩短其重复性工作的时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于电力调度领域的语音识别方法及装置
本专利技术涉及电力调度
，尤其涉及一种应用于电力调度领域的语音识别方法及装置。
技术介绍
各级电网调控中心是电网运行的组织、指挥、指导和协调机构，调控中心的调度员作为电网运行的直接指挥者，坚守在电网运行工作的第一线。随着全国联网规模的不断扩大和电压等级的不断提高，电网在设备数量、互联模式、耦合特性、复杂程度等方面已全面超越传统超高压交流电网，电网面临来自自然、人为、内在因素影响的问题也更为突出，并且，由于调控中心的调度员人数众多，因此调控中心不可避免地会出现较多噪音，这就造成调度员调度电网的工作量、复杂度和工作压力日益增大。目前调度运行工作中常规的事务性、例行性、程式化工作占据了调度员大量的时间和精力，使其无法专注于电网运行监视、风险分析和事故处理这些直接关系到电网安全稳定运行的核心任务。因此，急需充分挖掘调度规程、故障预案、调度日志等电网运行文本的基础上，形成电力特有的语音识别声学模型，并通过有效且符合电力调度特征的训练方法对模型进行训练，使得能够通过训练好的模型对电力调度领域中的语音进行识别，降低调度员的工作强度，并缩短调度员重复性工作的时间。
技术实现思路
针对现有技术存在的问题，本专利技术实施例提供一种应用于电力调度领域的语音识别方法及装置。第一方面，本专利技术实施例提供一种应用于电力调度领域的语音识别方法，包括：获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征；将所述功率归一化倒谱系数特征输...

【技术保护点】
1.一种应用于电力调度领域的语音识别方法，其特征在于，包括：/n获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征；/n将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络，得到新的特征；/n将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接，得到混合特征；/n将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络，得到词序列集合针对所述待识别语音特征的后验概率；/n根据所述后验概率结合语言模型对所述待识别语音进行解码，得到识别出的词序列；/n其中，所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的；/n所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。/n

【技术特征摘要】
1.一种应用于电力调度领域的语音识别方法，其特征在于，包括：
获取电力调度领域的待识别语音的功率归一化倒谱系数特征和说话人特征；
将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络，得到新的特征；
将所述新的特征、所述功率归一化倒谱系数特征和所述说话人特征进行拼接，得到混合特征；
将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络，得到词序列集合针对所述待识别语音特征的后验概率；
根据所述后验概率结合语言模型对所述待识别语音进行解码，得到识别出的词序列；
其中，所述预设神经网络模型是根据电力调度领域的多个语音样本进行训练后得到的；
所述语言模型是根据电力调度领域的文本采用N-GRAM模型训练后得到的。

2.根据权利要求1所述的方法，其特征在于，所述卷积神经网络中包括若干个卷积层，所述时间延迟神经网络中包括若干个时间延迟层，所述双向长短期记忆循环神经网络中包括若干个长短期记忆循环层。

3.根据权利要求1所述的方法，其特征在于，将所述功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络，之前还包括：
获取电力调度领域的多个语音样本；
通过所述多个语音样本对所述预设神经网络模型进行训练。

4.根据权利要求3所述的方法，其特征在于，获取电力调度领域的多个语音样本，包括：
获取电力调度领域的文本材料；
对获取到的文本材料进行去重操作；
通过多人对去重操作后的文本材料进行阅读录音，得到多声音频率段的电力调度领域的多个语音样本。

5.根据权利要求3所述的方法，其特征在于，通过所述多个语音样本对所述预设神经网络模型进行训练，包括：
对于任意一个语音样本，将所述语音样本的功率归一化倒谱系数特征输入至预设神经网络模型中的卷积神经网络，得到新的特征；
将所述新的特征、所述功率归一化倒谱系数特征和所述语音样本的说话人特征进行拼接，得到混合特征；
将所述混合特征输入至所述预设神经网络模型中的若干组交替设置的时间延迟神经网络和双向长短期记忆循环神经网络，得到词序列集合针对所述语音样本特征的后...

【专利技术属性】
技术研发人员：鄢发齐，汪旸，王春明，程迪，陈钟钟，刘志成，徐浩，董向明，孙涛，吴怡菲，曲亮，金勇，
申请(专利权)人：国家电网公司华中分部，武汉烽火普天信息技术有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人