一种用于电网调度业务的语音识别方法及系统技术方案

技术编号:37379235 阅读:11 留言:0更新日期:2023-04-27 07:21
本发明专利技术公开了一种用于电网调度业务的语音识别方法及系统,属于语音识别技术领域,包括以下步骤:S1:语音识别模型训练;S2:多语种语音识别。本发明专利技术采集电网调度业务中的日常业务电话语音,并进行标注,形成地方方言、地方普通话和标准普通话语料数据集,利用三种语料数据集训练得到对应的语音识别模型,再利用语音识别模型对电网调度业务的语音数据进行识别,可以在获取精确识别效果的基础上,大大降低模型参数量,模型训练的计算资源和时间成本得到有效降低,同时训练资源也得到有效降低。同时训练资源也得到有效降低。同时训练资源也得到有效降低。

【技术实现步骤摘要】
一种用于电网调度业务的语音识别方法及系统


[0001]本专利技术涉及语音识别
,具体涉及一种用于电网调度业务的语音识别方法及系统。

技术介绍

[0002]目前,在基层地方电网调度业务中,调度员的故障信息的记录仅仅只是简单的通过笔在纸上速记的方式。一旦纸上速记的内容变多,记录的内容与真实情况也可能存在一定偏差。既不规范,也存在一定的安全隐患。准确、高效的记录故障信息,关系到事故处理的准确性和快速性。通过语音识别的人工智能技术,将语音自动转换成文本,将能够提高故障记录的效率,有效地提高调度能力,保障电网调控运行的安全。
[0003]在电网地方基层单位,沟通交流往往以地方方言为主,地方普通话及标准普通话为辅助。同时电网调度特定的应用场景,语句、用词相对固定。在这种特定的应用场景中,采用通用的语音识别模型,不适应。采用通用的离线语音识别模型,存在以下问题:需要巨量的语料资源进行模型训练;模型参数量将会巨大,模型训练的计算资源和时间成本巨大;同时在一个通用模型中适应多语种识别,将进一步扩大模型,降低识别准确率。上述问题亟待解决,为此,提出一种用于电网调度业务的语音识别方法及系统。

技术实现思路

[0004]本专利技术所要解决的技术问题在于:如何解决现有技术中采用通用离线语音识别模型存在的需要巨量的语料资源进行模型训练;模型参数量将会巨大,模型训练的计算资源和时间成本巨大;同时在一个通用模型中适应多语种识别,将进一步扩大模型,降低识别准确率的问题,提供了一种用于电网调度业务的语音识别方法。
[0005]本专利技术是通过以下技术方案解决上述技术问题的,本专利技术包括以下步骤:
[0006]S1:语音识别模型训练
[0007]采集电网调度业务中的日常业务电话语音,并进行标注,形成地方方言、地方普通话和标准普通话3个语料数据集;基于VGG卷积神经网络构建深度全卷积神经网络语音识别模型;分别利用地方方言、地方普通话与标准普通话语料数据集对深度全卷积神经网络语音识别模型训练,得到3种语音识别模型;
[0008]S2:多语种语音识别
[0009]利用步骤S1中训练的3种语音识别模型对电网调度业务中日常业务电话语音进行语音识别。
[0010]更进一步地,在所述步骤S1中,深度全卷积神经网络语音识别模型包括第一卷积层~第五卷积层,第一卷积层~第五卷积层依次连接,各个卷积层之间均进行最大池化处理。
[0011]更进一步地,第一卷积层~第五卷积层的卷积核均为3x3,所述池化单元尺寸均为2x2。
[0012]更进一步地,在所述步骤S2中,具体包括以下子步骤:
[0013]S21:启动语音识别服务,从步骤2中训练完毕的3种语音识别模型选择语音识别模型;同时启动电话语音采集,接听来电,将语音数据送入缓存,并将缓存中的语音数据发送至语音识别服务再清空缓存;
[0014]S22:通过当前语音识别模型进行语音识别,生成拼音序列,再通过动态规划算法和词频库判断,将拼音序列转成汉字序列的句子,然后通过循环神经元网络,对句子进行语义完整性分析;
[0015]S23:当判定语义完整时,输出语音识别结果并统计语音使用概率;当判定语义不完整时,判断是否使用过设定种类的语音识别模型进行识别,是则选择在多次语音识别中完整性最高的为语音识别结果输出并统计语音使用概率,否则选择未使用过的且使用概率最高的语音识别模型作为当前语音识别模型,再次进入步骤S22中进行识别,输出语音识别结果并统计语音使用概率。
[0016]更进一步地,在步骤S21中,选择语音识别模型时,先载入各个语音识别模型,并读取各种语音使用概率,选择语音使用概率最大的语音识别模型作为当前语音识别模型。
[0017]更进一步地,在步骤S22中,通过动态规划算法和词频库判断,将拼音序列转成汉字序列的句子,其中,从拼音到汉字的转换过程视为在一个有向图中求解转移概率的最短路径的问题,求解最短路径,采用动态规划算法,汉字之间的转移概率通过查询预先建立的词频库获得。
[0018]更进一步地,在步骤S22中,通过循环神经元网络,对句子进行语义完整性分析,具体过程如下:
[0019]在本实施例中,在步骤S22中,通过循环神经元网络,对句子进行语义完整性分析,具体步骤如下:
[0020]S221:句子语义完整性分析网络模型训练
[0021]构建双层Bi

LSTM网络;对语料库数据集中的句子进行分词预处理,得到词序列;将词序列映射为相应的词向量,并采用四元标注集T={S,B,M,E}进行标注;其中,B表示为一个语义完整句的开头词,M表示为一个语义完整句的中间词,E表示为一个语义完整句的结尾词,S表示为特定符号前面和后面最靠近的一个词;利用标注后的词向量对双层Bi

LSTM网络进行训练;
[0022]S222:句子进行语义完整性分析
[0023]对汉字序列的句子进行分词预处理,得到词序列;将词序列映射为相应的词向量;通过训练后的双层Bi

LSTM网络进行预测,输出相应词向量的标签{S,B,M,E}概率,选取概率最大的标签作为预测结果;依据输出的标签{S,B,M,E}的个数进行句子完整性判别;其中,一个语义完整句子,E和B标签的数目为1,S标签数目与句中标点符号有关,为0、2或4个;M为多个。
[0024]更进一步地,在步骤S22中,将拼音序列转成汉字序列时,根据词频高低,选择词频最高的同音词或同音字。
[0025]更进一步地,在步骤S2中,识别后,提供人工校准识别结果,然后通过对校准后的语音识别结果句子进行分词,统计并更新词频。
[0026]本专利技术还公开了一种用于电网调度业务的语音识别系统,利用上述的语音识别方
法进行语音识别,包括:
[0027]模型训练模块,用于采集电网调度业务中的日常业务电话语音,并进行标注,形成地方方言、地方普通话和标准普通话3个语料数据集;基于VGG卷积神经网络构建深度全卷积神经网络语音识别模型;分别利用地方方言、地方普通话与标准普通话语料数据集对深度全卷积神经网络语音识别模型训练,得到3种语音识别模型;
[0028]语音识别模块,用于利用步骤S1中训练的3种语音识别模型对电网调度业务中日常业务电话语音进行语音识别;
[0029]控制处理模块,用于向其他模块发出指令,完成相关动作;
[0030]所述模型训练模块、语音识别模块均与控制处理模块电连接。
[0031]本专利技术相比现有技术具有以下优点:该用于电网调度业务的语音识别方法及系统,采集电网调度业务中的日常业务电话语音,并进行标注,形成地方方言、地方普通话和标准普通话语料数据集,利用三种语料数据集训练得到对应的语音识别模型,再利用语音识别模型对电网调度业务的语音数据进行识别,可以在获取精确识别效果的基础上,大大降低模型参数量,模型训练的计算资源和时间成本得到有效降低,同时训练资源也得到有效降低。
...

【技术保护点】

【技术特征摘要】
1.一种用于电网调度业务的语音识别方法,其特征在于,包括以下步骤:S1:语音识别模型训练采集电网调度业务中的日常业务电话语音,并进行标注,形成地方方言、地方普通话和标准普通话3个语料数据集;基于VGG卷积神经网络构建深度全卷积神经网络语音识别模型;分别利用地方方言、地方普通话与标准普通话语料数据集对深度全卷积神经网络语音识别模型训练,得到3种语音识别模型;S2:多语种语音识别利用步骤S1中训练的3种语音识别模型对电网调度业务中日常业务电话语音进行语音识别。2.根据权利要求1所述的一种用于电网调度业务的语音识别方法,其特征在于:在所述步骤S1中,深度全卷积神经网络语音识别模型包括第一卷积层~第五卷积层,第一卷积层~第五卷积层依次连接,各个卷积层之间均利用池化单元进行最大池化处理。3.根据权利要求2所述的一种用于电网调度业务的语音识别方法,其特征在于:第一卷积层~第五卷积层的卷积核均为3x3,所述池化单元尺寸均为2x2。4.根据权利要求2所述的一种用于电网调度业务的语音识别方法,其特征在于:在所述步骤S2中,具体包括以下子步骤:S21:启动语音识别服务,从步骤2中训练完毕的3种语音识别模型选择语音识别模型;同时启动电话语音采集,接听来电,将语音数据送入缓存,并将缓存中的语音数据发送至语音识别服务再清空缓存;S22:通过当前语音识别模型进行语音识别,生成拼音序列,再通过动态规划算法和词频库判断,将拼音序列转成汉字序列的句子,然后通过循环神经元网络,对句子进行语义完整性分析;S23:当判定语义完整时,输出语音识别结果并统计语音使用概率;当判定语义不完整时,判断是否使用过设定种类的语音识别模型进行识别,是则选择在多次语音识别中完整性最高的为语音识别结果输出并统计语音使用概率,否则选择未使用过的且使用概率最高的语音识别模型作为当前语音识别模型,再次进入步骤S22中进行识别,输出语音识别结果并统计语音使用概率。5.根据权利要求4所述的一种用于电网调度业务的语音识别方法,其特征在于:在步骤S21中,选择语音识别模型时,先载入各个语音识别模型,并读取各种语音使用概率,选择语音使用概率最大的语音识别模型作为当前语音识别模型。6.根据权利要求5所述的一种用于电网调度业务的语音识别方法,其特征在于:在步骤S22中,通过动态规划算法和词频库判断,将拼音序列转成汉字序列的句子,其中,从拼音到汉字的转换过程视为在一个有向图中求解转移概率的最短路径的问题,...

【专利技术属性】
技术研发人员:王振戴悦蒋季铭葛薇薇李亚楠李园园刘清峰任飞宇查显杰张金程龙孙冰罗亮吴丽胜仝开峰王康范平王陈方勇王申坤韦华聂云巫仕明葛俊严行忠翟恩宏王平平姚露露
申请(专利权)人:国网安徽省电力有限公司和县供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1