语音识别方法、装置、电子设备制造方法及图纸

技术编号：35673158 阅读：18 留言：0更新日期：2022-11-23 14:09

本申请公开了一种语音识别方法，属于计算机技术领域，有助于提升语音识别的效率。所述方法包括：通过预先训练的流式模型的编码模块，对实时获取的语音片段进行编码，输出所述实时获取的语音片段的第一隐层向量表示；通过流式模型的解码模块，对所述第一隐层向量表示进行解码，确定实时获取的语音片段对应的实时识别结果；通过预先训练的非流式模型，基于实时获取的语音片段所属语音输入中各时刻获取的语音片段的第一隐层向量表示，对实时识别结果进行重打分，确定实时识别结果对应所语音输入整体的准确度评分。入整体的准确度评分。入整体的准确度评分。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备

[0001]本申请实施例涉及计算机
，特别是涉及一种语音识别方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]端到端语音识别技术是一种重要的语音识别技术，在许多场景下取得了比传统语音识别方案更好的识别效果。例如，在设备端等一些应用场景(如语音搜索、语音输入法)中，需要对语音数据进行流式的识别，即用户一边说话，一边返回识别结果，应用流式端到端的语音识别技术即可实现对输入语音的实时识别。为了提高流式端到端语音识别技术的性能，现有技术中通常采用两遍编解码的方案，即先使用一个流式端到端模型进行第一遍编解码，得到得分最高的n个候选识别结果，然后使用另一个非流式的端到端模型对n个候选识别结果进行重打分，这是第二遍编解码。现有技术中采用的两遍编解码的方案至少存在以下缺陷：第一遍编解码采用的流式解码模型和第二遍编解码采用的非流式解码模型是两个不同的模型，需要对输入语音执行两遍编码和解码，语音识别运算量大，效率低。
[0003]可见，现有技术中的语音识别方法还需要改进。

技术实现思路

[0004]本申请实施例提供一种语音识别方法，有助于提升语音识别的效率。
[0005]第一方面，本申请实施例提供了一种语音识别方法，包括：
[0006]通过预先训练的流式模型的编码模块，对实时获取的语音片段进行编码，输出所述实时获取的语音片段的第一隐层向量表示；
[0007]通过所述流式模型的解码模块，对所述第一隐层向量表示进行解码，确定所述实时获取的语音...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：通过预先训练的流式模型的编码模块，对实时获取的语音片段进行编码，输出所述实时获取的语音片段的第一隐层向量表示；通过所述流式模型的解码模块，对所述第一隐层向量表示进行解码，确定所述实时获取的语音片段对应的实时识别结果；通过预先训练的非流式模型，基于所述实时获取的语音片段所属语音输入中各时刻获取的语音片段的所述第一隐层向量表示，对所述实时识别结果进行重打分，确定所述实时识别结果对应所述语音输入整体的准确度评分；其中，所述非流式模型共享所述流式模型的模型参数。2.根据权利要求1所述的方法，其特征在于，所述确定所述实时获取的语音片段对应的实时识别结果的步骤之后，还包括：输出得分最高的所述实时识别结果。3.根据权利要求1所述的方法，其特征在于，所述通过预先训练的非流式模型，基于所述实时获取的语音片段所属语音输入中各时刻获取的语音片段的所述第一隐层向量表示，对所述实时识别结果进行重打分，确定所述实时识别结果对应所述语音输入整体的准确度评分的步骤，包括：通过预先训练的非流式模型执行教师强制方法，以所述实时获取的语音片段所属语音输入中各时刻获取的语音片段的所述第一隐层向量表示，和所述实时识别结果作为输入，进行前向推理，对所述实时识别结果进行重打分，确定所述实时识别结果对应所述语音输入整体的准确度评分。4.根据权利要求3所述的方法，其特征在于，所述确定所述实时识别结果对应所述语音输入整体的准确度评分的步骤之后，还包括：输出所述实时识别结果相对于相应所述非流式识别结果的准确度评分。5.根据权利要求1至4任一项所述的方法，其特征在于，所述通过所述流式模型的解码模块，对所述第一隐层向量表示进行解码，确定所述实时获取的语音片段对应的实时识别结果的步骤，包括：通过所述流式模型的预测模块，对所述第一隐层向量表示进行长度预测，预估所述第一隐层向量表示匹配的解码字符数量；通过所述流式模型的解码模块，基于所述第一隐层向量表示、所述第一隐层向量表示的上下文向量表示，以及所述解码字符数量，进行自回归解码，确定所述实时获取的语音片段对应的所述解码字符数量个字符各自的实时识别结果。6.根据权利要求1至4任一项所述的方法，其特征在于，所述流式模型和所述非流式模型是通过以下方法训练的：获取若干训练样本，其中，所述训练样本的样本数据为语音片...

【专利技术属性】
技术研发人员：丁科，向鸿雨，万广鲁，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人