流式语音识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号：32119701 阅读：32 留言：0更新日期：2022-01-29 19:05

本申请涉及语音识别技术领域，具体涉及一种流式语音识别方法及装置、电子设备、存储介质，所述方法包括：获取待识别的语音块；基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果，并根据所述对象识别结果确定所述语音块中对象的数量；根据所述语音块中对象的数量确定识别次数，并基于注意力模型对所述语音块进行所述识别次数的语音识别处理，得到与所述语音块对应的语音识别结果。所述方法通过联结主义时间分类模型预测当前语音块所包含的识别对象的数量作为注意力模型的语音识别次数，通过注意力模型对语音块进行相应次数的识别，能够更为准确、高效地对语音进行识别并将其转化输出为对应的文字等信息。信息。信息。

全部详细技术资料下载

【技术实现步骤摘要】
流式语音识别方法及装置、电子设备、存储介质

[0001]本申请涉及语音识别
，具体涉及一种流式语音识别方法及装置、电子设备、存储介质。

技术介绍

[0002]语音识别也被称为自动语音识别(Automatic Speech Recognition，ASR)，其目标是让机器通过识别和理解把接收到的语音信号变成文字进行输出，语音识别是现代人工智能发展的重要分支。
[0003]传统的语音识别技术是基于隐马尔科夫模型、高斯混合模型以及深度神经网络
‑
隐马尔科夫模型进行声学模型的建立，这种以语言模型、声学模型、词典模型构成的网络进行识别的方法需要针对不同的模型分别进行训练，然后通过加权有限状态转换机(WFST)等解码器将多个模型融合到一起。其中每个模型的训练或设计均需要专业知识和技术积累，而各模型进行训练及识别的过程甚为繁琐且识别效率低、准确度低并存在较大延迟。因此，有必要提供一种新的语音识别技术以解决现有技术中存在的上述问题。

技术实现思路

[0004]本申请的目的在于提供一种流式语音识

【技术保护点】

【技术特征摘要】
1.一种流式语音识别方法，其特征在于，包括以下步骤：获取待识别的语音块；基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果，并根据所述对象识别结果确定所述语音块中对象的数量；根据所述语音块中对象的数量确定识别次数，并基于注意力模型对所述语音块进行所述识别次数的语音识别处理，得到与所述语音块对应的语音识别结果。2.根据权利要求1所述的流式语音识别方法，其特征在于，所述基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果，并根据所述对象识别结果确定所述语音块中对象的数量，包括：基于联结主义时间分类模型对所述语音块进行对象识别处理，得到至少一组对象识别处理的结果及对应的准确度；确定所述准确度最高的一组对象识别处理的结果作为所述对象识别处理结果；根据所述对象识别结果确定所述语音块中对象的数量。3.根据权利要求1所述的流式语音识别方法，其特征在于，所述基于联结主义时间分类模型对所述语音块进行对象识别处理得到对象识别结果，包括：对所述语音块进行编码处理，得到所述语音块的特征序列；基于联结主义时间分类模型对所述语音块的特征序列进行对象识别处理得到对象识别结果。4.根据权利要求1所述的流式语音识别方法，其特征在于，所述根据所述语音块中对象的数量确定识别次数，并基于注意力模型对所述语音块进行所述识别次数的语音识别处理，得到与所述语音块对应的语音识别结果，包括：根据所述语音块中对象的数量确定识别次数，并基于注意力模型对所述语音块进行所述识别次数的语音识别处理，得到至少一组语音识别处理的结果及对应的准确度；确定所述准确度最高的一组语音识别...

【专利技术属性】
技术研发人员：洪密，王旭阳，汪俊杰，
申请(专利权)人：联想北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人