语音识别的后处理方法、装置和计算机设备制造方法及图纸

技术编号：31094730 阅读：39 留言：0更新日期：2021-12-01 13:03

本申请提供了一种语音识别的后处理方法、装置和计算机设备，识别系统首先获取语音识别模型输出的序列矩阵，以及预设的候选词列表，其中，候选词列表包含多个候选词。识别系统根据各个候选词各自在序列矩阵的候选词路径之和，分别计算得到各个候选词对应的候选词得分。最后，控制系统根据各个候选词各自对应的候选词得分以及候选词长度，筛选得到语音识别的最终结果。本申请通过在预设的候选词列表的基础上，对序列矩阵进行筛选，从而减少了候选词路径的搜索规模，提高了搜索速度。并在筛选语音识别的最终结果时，综合了各个候选词的候选词得分以及候选词长度，从而规避了识别结果偏向于候选词长度较短的不足，有效提高了语音识别的准确率。识别的准确率。识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别的后处理方法、装置和计算机设备

[0001]本申请涉及语音识别
，特别涉及一种语音识别的后处理方法、装置和计算机设备。

技术介绍

[0002]唤醒词、命令词识别属于语音识别领域，广泛应用于智能家居、智能终端等场景。现有唤醒词、命令词模型在应用时，实时检测用户的语音，当检测到特定词汇时，即做出反馈。语音识别一般的后处理方式为：在语音识别模型输出的解码空间(比如CTC方式为神经网络输出的音素概率矩阵，大小是序列长度*音素类数的矩阵)搜索最优路径，该最优路径即为最终的识别结果。
[0003]在解码空间搜索最优路径时，其基本原理为概率值相乘从而得到路径的得分，这种处理方式就决定了命令词长度短的候选词的路径，相比命令词长的候选词的路径，在相同条件下，可获得更高的分值（比如命令词“你好”“你好，XX”，则“你好”会获得更高的分值从而被判定为最终识别结果），从而有可能出现命令词误识别，严重影响了语音识别的准确度。

技术实现思路

[0004]本申请的主要目的为提供一种语音识别的后处理方法、装置和计算机设...

【技术保护点】

【技术特征摘要】
1.一种语音识别的后处理方法，其特征在于，包括：获取语音识别模型输出的序列矩阵，以及预设的候选词列表，所述候选词列表包含多个候选词；根据各所述候选词各自在所述序列矩阵的候选词路径之和，分别计算得到各所述候选词对应的候选词得分；根据各所述候选词各自对应的候选词得分以及候选词长度，筛选得到语音识别的最终结果。2.根据权利要求1所述的语音识别的后处理方法，其特征在于，所述根据各所述候选词各自在所述序列矩阵的候选词路径之和，分别计算得到各所述候选词对应的候选词得分的步骤，包括：从所述序列矩阵中剔除无效列，并根据剔除所述无效列后的序列矩阵获取各所述候选词各自对应的所有候选词路径的得分总和，所述无效列表征所述序列矩阵中有效信息达不到预设要求的列；获取各所述候选词对应的有效长度，并将所述得分总和除以所述有效长度，得到各所述候选词对应的候选词得分。3.根据权利要求2所述的语音识别的后处理方法，其特征在于，所述从所述序列矩阵中剔除无效列的步骤，包括：识别所述序列矩阵中blank对应的分数值是否大于第一阈值；若所述序列矩阵中blank对应的分数值大于第一阈值，则将所述blank所在的列判定为所述无效列。4.根据权利要求2所述的语音识别的后处理方法，其特征在于，所述获取各所述候选词对应的有效长度的步骤，单个所述候选词的有效长度的获取步骤为：调取窗口长度，并计算所述窗口长度与所述候选词对应的得分总和之间的差值，得到所述候选词的有效长度，所述窗口长度与所述语音识别模型的输入语音数据相关联。5.根据权利要求1所述的语音识别的后处理方法，其特征在于，所述根据各所述候选词各自对应的候选词得分以及候选词长度，筛选得到语音识别的最终结果的步骤，包括：将各所述候选词按照各自对应的候选词得分从大到小进行排序，形成候选词得分列表，并将各所述候选词的候选词长度对应标注在所述候选词得分列表上；依次遍历所述候选词得分列表中的各所述候选词，判断排序第一的候选词对应的第一候选词得分是否大于第二阈值；若所述排序第一的候选词对应的第一候选词得分大于第二阈值，则判断排序第二的候选词对应的第二候选词得分是否大于所述第二阈值；若排序第二的候选词对应的第二候选...

【专利技术属性】
技术研发人员：李杰，王广新，杨汉丹，
申请(专利权)人：深圳市友杰智新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人