【技术实现步骤摘要】
用于生成语音识别网络的方法、装置、电子设备和介质
本公开的实施例涉及计算机
,具体涉及用于生成语音识别网络的方法、装置、电子设备和介质。
技术介绍
随着互联网的发展和以深度学习为核心的人工智能技术的普及,语音识别技术应用到人们生活的各个领域,现有相关语音识别网络在识别过程中对于一些特定的词识别的召回率不高。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了用于生成语音识别网络的方法、装置、设备和介质,来解决以上
技术介绍
部分提到的技术问题。第一方面,本公开的一些实施例提供了一种用于生成语音识别网络的方法,该方法包括:将第一预设语言模型、预先训练的声学模型、词典以及相关上下文分别对应的加权有限状态机进行组合,得到第一词图;基于上述第一词图和第二语言模型对应的加权有限状态机,生成第一解码网络,上述第二语言模型 ...
【技术保护点】
1.一种用于生成语音识别网络的方法,包括:/n将第一预设语言模型、预先训练的声学模型、词典以及用于处理相关上下文的模型分别对应的加权有限状态机进行组合,得到第一词图;/n基于所述第一词图和第二语言模型对应的加权有限状态机,生成第一解码网络,所述第二语言模型是基于所述第一词图得到的。/n
【技术特征摘要】
1.一种用于生成语音识别网络的方法,包括:
将第一预设语言模型、预先训练的声学模型、词典以及用于处理相关上下文的模型分别对应的加权有限状态机进行组合,得到第一词图;
基于所述第一词图和第二语言模型对应的加权有限状态机,生成第一解码网络,所述第二语言模型是基于所述第一词图得到的。
2.根据权利要求1所述的方法,其中,所述第一预设语言模型对应的加权有限状态机是一个状态搜索空间,所述状态搜索空间中包含至少一条用来匹配目标词的路径以提高至少一个目标字在文本中出现的概率。
3.根据权利要求1所述的方法,其中,所述第二语言模型是一个一元文法语言模型。
4.根据权利要求1所述的方法,其中,所述方法还包括:
通过第三预设语言模型对应的加权有限状态机对所述第一解码网络中所述第一预设语言模型对应的加权有限状态机进行处理,得到第二词图;
将第四预设语言模型对应的加权有限状态机和所述第二词图进行组合,得到第二解码网络,其中,所述第二解码网络存在多条包含目标词的词串的候选路径。
5.根据权利要求4所述的方法,其中,所述第三预设语言模型对应的加权有限状态机是通过以下步骤得到:
对所述第一预设语言模型对应的加权有限状态机中的至少一条路径上的权重取相反数,得到第三预设语言模型对应的加权有限状态机。
6.根据权利要求4所述的方法,其中,所述第四预设语言模型是一个n元文法...
【专利技术属性】
技术研发人员:蔡猛,蔡建伟,姚佳立,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。