语音识别的方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号：25693244 阅读：134 留言：0更新日期：2020-09-18 21:04

本公开的实施例公开了语音识别的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：针对目标语音的语音帧序列中的每个语音帧，生成上述语音帧的音节概率集合，得到音节概率集合序列，其中，上述音节概率集合用于表征上述语音帧表达的是预设的多个音节中各个音节的概率；基于上述音节概率集合序列和预先训练的语言模型，生成目标文字。该实施方式通过外接语言模型再解码，使得语音识别的结果更准确，进一步的，提升了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别的方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
，具体涉及语音识别的方法、装置、电子设备和计算机可读介质。
技术介绍
目前，语音识别已经广泛的应用在人们的生活中。然而，相关的方法在语音识别过程中，往往存在语音识别不准确的现象，从而导致用户体验差。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了用于语音识别的方法、装置、设备和计算机可读介质，来解决以上
技术介绍
部分提到的技术问题。第一方面，本公开的一些实施例提供了一种语音识别的方法，该方法包括：针对目标语音的语音帧序列中的每个语音帧，生成上述语音帧的音节概率集合，得到音节概率集合序列，其中，上述音节概率集合用于表征上述语音帧表达的是预设的多个音节中各个音节的概率；基于上述音节概率集合序列和预先训练的语言模型，生成目标文字...

【技术保护点】
1.一种语音识别的方法，包括：/n针对目标语音的语音帧序列中的每个语音帧，生成所述语音帧的音节概率集合，得到音节概率集合序列，其中，所述音节概率集合用于表征所述语音帧表达的是预设的多个音节中各个音节的概率；/n基于所述音节概率集合序列和预先训练的语言模型，生成目标文字。/n

【技术特征摘要】
1.一种语音识别的方法，包括：
针对目标语音的语音帧序列中的每个语音帧，生成所述语音帧的音节概率集合，得到音节概率集合序列，其中，所述音节概率集合用于表征所述语音帧表达的是预设的多个音节中各个音节的概率；
基于所述音节概率集合序列和预先训练的语言模型，生成目标文字。

2.根据权利要求1所述的方法，其中，所述针对目标语音的语音帧序列中的每个语音帧，生成所述语音帧的音节概率集合，得到音节概率集合序列，包括：
针对所述目标语音的语音帧序列中的每个语音帧，将所述语音帧输入预先训练的循环神经网络转换器RNNT，生成所述语音帧的音节概率集合。

3.根据权利要求2所述的方法，其中，所述基于所述音节概率集合序列和预先训练的语言模型，生成目标文字，包括：
针对所述音节概率集合序列中的每个音节概率集合，从所述音节概率集合中选出符合预定条件的音节概率，得到音节概率子集合，得到音节概率子集合序列；
基于所述音节概率子集合序列和剪枝算法，生成多条路径和多条路径对应的分数，其中，所述路径是包含多个音节的序列，所述分数是所述序列中多个音节概率的乘积；
基于所述多条路径、所述多条路径对应的分数、目标字典和所述预先训练的语言模型，得到所...

【专利技术属性】
技术研发人员：蔡猛，梁镇麟，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人