【技术实现步骤摘要】
流式语音识别方法及装置、电子设备、存储介质
[0001]本申请涉及语音识别
,具体涉及一种流式语音识别方法及装置、电子设备、存储介质。
技术介绍
[0002]语音识别也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是让机器通过识别和理解把接收到的语音信号变成文字进行输出,语音识别是现代人工智能发展的重要分支。
[0003]传统的语音识别技术是基于隐马尔科夫模型、高斯混合模型以及深度神经网络
‑
隐马尔科夫模型进行声学模型的建立,这种以语言模型、声学模型、词典模型构成的网络进行识别的方法需要针对不同的模型分别进行训练,然后通过加权有限状态转换机(WFST)等解码器将多个模型融合到一起。其中每个模型的训练或设计均需要专业知识和技术积累,而各模型进行训练及识别的过程甚为繁琐且识别效率低、准确度低并存在较大延迟。因此,有必要提供一种新的语音识别技术以解决现有技术中存在的上述问题。
技术实现思路
[0004]本申请的目的在于提供一种流式语音识
【技术保护点】
【技术特征摘要】
1.一种流式语音识别方法,其特征在于,包括以下步骤:获取待识别的语音块;基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果,并根据所述对象识别结果确定所述语音块中对象的数量;根据所述语音块中对象的数量确定识别次数,并基于注意力模型对所述语音块进行所述识别次数的语音识别处理,得到与所述语音块对应的语音识别结果。2.根据权利要求1所述的流式语音识别方法,其特征在于,所述基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果,并根据所述对象识别结果确定所述语音块中对象的数量,包括:基于联结主义时间分类模型对所述语音块进行对象识别处理,得到至少一组对象识别处理的结果及对应的准确度;确定所述准确度最高的一组对象识别处理的结果作为所述对象识别处理结果;根据所述对象识别结果确定所述语音块中对象的数量。3.根据权利要求1所述的流式语音识别方法,其特征在于,所述基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果,包括:对所述语音块进行编码处理,得到所述语音块的特征序列;基于联结主义时间分类模型对所述语音块的特征序列进行对象识别处理得到对象识别结果。4.根据权利要求1所述的流式语音识别方法,其特征在于,所述根据所述语音块中对象的数量确定识别次数,并基于注意力模型对所述语音块进行所述识别次数的语音识别处理,得到与所述语音块对应的语音识别结果,包括:根据所述语音块中对象的数量确定识别次数,并基于注意力模型对所述语音块进行所述识别次数的语音识别处理,得到至少一组语音识别处理的结果及对应的准确度;确定所述准确度最高的一组语音识别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。