一种语音识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:28118733 阅读:23 留言:0更新日期:2021-04-19 11:21
本申请提供了一种语音识别方法、装置、电子设备及可读存储介质,包括将获取的待识别语音信号输入至预先训练好的语音识别模型中,得到与待识别语音信号相匹配的识别文本;语音识别模型包括声学模型和语言模型,语言模型由基础语言模型和专用语言模型插值生成,专用语言模型由规整后的指令文本分词得到的分词文本,分词文本对应的扩充文本,以及分词文本对应的扩充发音词典训练得到,扩充发音词典由初始发音词典经过扩充得到,最后确定与识别文本对应的语音指令。本申请可以提升中文和英文字母混合、专有领域的专业词汇、中文和少量单词混合的识别准确率,有效提升了智能系统、智能设备或巡检机器人与电力系统对接时的匹配准确率。或巡检机器人与电力系统对接时的匹配准确率。或巡检机器人与电力系统对接时的匹配准确率。

【技术实现步骤摘要】
一种语音识别方法、装置、电子设备及可读存储介质


[0001]本申请涉及智能语音
,具体而言,涉及一种语音识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]变电站的正常运行直接关系整个电力系统的稳定安全,随着科学技术的发展,越来越多的智能系统、智能设备和巡检机器人应用到变电站管理中,以提高巡检的安全性和准确性,其中,绝大多数智能设备都采用语音指令来控制。
[0003]应用在变电站的语音指令主要包括通用类指令、系统控制类指令和设备控制类指令。采用现有的普通话识别方式即可完成对通用类指令和系统控制类指令的识别,但是由于设备控制类指令比较复杂,读音种类和书写格式比较丰富,采用现有的语音识别方式来识别这类设备控制类指令时,识别效果较差,导致在智能系统、智能设备或巡检机器人与电力系统对接时,匹配的准确率较低。

技术实现思路

[0004]有鉴于此,本申请的目的在于提供一种语音识别方法、装置、电子设备及可读存储介质,可以提升中文和英文字母混合、专有领域的专业词汇、中文和少量单词混合的识别准确率,在提升专有领域的语音识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括:获取待识别语音信号;将获取到的待识别语音信号输入至预先训练好的语音识别模型中,得到与所述待识别语音信号相匹配的识别文本;所述语音识别模型包括声学模型和语言模型,所述语言模型由基础语言模型和专用语言模型插值生成,所述专用语言模型是由规整后的指令文本分词得到的分词文本,所述分词文本对应的扩充文本,以及所述分词文本对应的扩充发音词典训练得到的,其中,所述扩充发音词典是由初始发音词典经过扩充得到的;确定与所述识别文本对应的语音指令。2.根据权利要求1所述的语音识别方法,其特征在于,所述获取待识别语音信号,包括:采集语音信号;对采集到的语音信号进行语音端点检测和噪声检测,得到待识别语音信号。3.根据权利要求1所述的语音识别方法,其特征在于,通过以下步骤对指令文本进行规整:获取文本规整对应的词性规则和业务规则;基于所述词性规则和所述业务规则,分别对所述指令文本进行规整,得到词性规整结果和业务规整结果;将所述词性规整结果和所述业务规整结果进行交叉验证;基于所述词性规整结果和所述业务规整结果的交叉验证结果,确定规整后的指令文本。4.根据权利要求3所述的语音识别方法,其特征在于,通过以下步骤对规整后的指令文本分词得到分词文本:对规整后的指令文本进行分词处理,得到中文分词结果和英文分词结果,其中,所述英文分词结果包括至少一种不同英文字母的组合;统计所述不同英文字母的组合在所有规整后的指令文本中出现的次数;根据所述次数与设定阈值的比对结果,更新所述英文分词结果;基于中文分词结果以及更新后的英文分词结果,确定分词文本。5.根据权利要求4所述的语音识别方法,其特征在于,通过以下步骤确定所述分词文本对应的扩充文本:获取规整后的指令文本中所有与英文字母相邻的汉字,得到扩充汉字集;将所有英文字母与所述扩充汉字集中...

【专利技术属性】
技术研发人员:胡广宇邓菁吴富章
申请(专利权)人:北京远鉴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1