语音识别方法、装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号：38535445 阅读：11 留言：0更新日期：2023-08-19 17:06

本申请适用于终端技术领域，尤其涉及一种语音识别方法、装置、终端设备及计算机可读存储介质。该方法中，终端设备获取待识别语音后，可以利用端到端的语音识别模型对待识别语音进行语音识别，得到识别结果。其中，对于语音识别模型的每一次解码，终端设备可以根据N

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、终端设备及计算机可读存储介质

[0001]本申请属于终端
，尤其涉及一种语音识别方法、装置、终端设备及计算机可读存储介质。

技术介绍

[0002]基于端到端的语音识别技术使用一个神经网络模型直接完成从语音到文字的转换，例如，基于注意力(Attention)的神经网络模型。其中，基于Attention的神经网络模型一般包含一个编码器和一个基于Attention机制的解码器。编码器把语音特征序列转换为隐状态向量序列。解码器通过自回归的方式和Attention机制，把注意力集中到其中的一部分隐状态向量序列上，单步输出解码结果。在解码过程中，一般是采用集束搜索(BeamSearch)获取概率最高的前几个字/词/句子作为候选解码结果。即神经网络模型是基于概率在解码空间中搜索，具有不确定性，针对口音等发音不准确的情况，可能会给出不符合语法的解码结果，导致语音识别准确性较低。

技术实现思路

[0003]本申请实施例提供了一种语音识别方法、装置、终端设备及计算机可读存储介质，可以解决语音识别准确性较低的问题。
[0004]第一方面，本申请实施例提供了一种语音识别方法，应用于终端设备，所述方法可以包括：
[0005]所述终端设备获取待识别语音；
[0006]所述终端设备利用语音识别模型对所述待识别语音进行语音识别，得到识别结果；
[0007]其中，所述语音识别模型为端到端的语音识别模型，在利用所述语音识别模型对所述待识别语音进行语音识别时，对于所述语音识别模型的...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，应用于终端设备，其特征在于，所述方法包括：所述终端设备获取待识别语音；所述终端设备利用语音识别模型对所述待识别语音进行语音识别，得到识别结果；其中，所述语音识别模型为端到端的语音识别模型，在利用所述语音识别模型对所述待识别语音进行语音识别时，对于所述语音识别模型的每一次解码，所述终端设备根据N
‑
gram语言模型，确定候选解码结果对应的第一概率，所述候选解码结果对应的第一概率用于确定所述语音识别模型下一次解码得到的候选解码结果。2.根据权利要求1所述的方法，其特征在于，所述终端设备根据N
‑
gram语言模型，确定候选解码结果对应的第一概率，包括：所述终端设备获取所述候选解码结果对应的第二概率，所述候选解码结果对应的第二概率为所述语音识别模型确定的；所述终端设备根据N
‑
gram语言模型和所述候选解码结果对应的第二概率，确定所述候选解码结果对应的第一概率。3.根据权利要求2所述的方法，其特征在于，所述终端设备根据N
‑
gram语言模型和所述候选解码结果对应的第二概率，确定所述候选解码结果对应的第一概率，包括：所述终端设备根据N
‑
gram语言模型，确定所述候选解码结果对应的第一权重；所述终端设备根据所述候选解码结果对应的第二概率和第一权重，确定所述候选解码结果对应的第一概率。4.根据权利要求3所述的方法，其特征在于，所述终端设备根据N
‑
gram语言模型，确定所述候选解码结果对应的第一权重，包括：当所述候选解码结果存在于所述N
‑
gram语言模型时，所述终端设备确定所述N
‑
gram语言模型中的所述候选解码结果对应的第二权重，并根据所述第二权重，确定所述候选解码结果对应的第一权重；当所述候选解码结果不存在于所述N
‑
gram语言模型时，所述终端设备确定所述候选解码结...

【专利技术属性】
技术研发人员：杨显杰，黄东延，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人