模型输出的后处理方法、装置和计算机设备制造方法及图纸

技术编号：31226936 阅读：19 留言：0更新日期：2021-12-08 09:34

本申请提供了一种模型输出的后处理方法、装置和计算机设备，识别系统获取语音识别模型输出的概率矩阵，在概率矩阵中进行窗口搜索，基于阈值对所述概率矩阵进行规则处理，剔除概率矩阵中的无效路径，并且概率矩阵的后一窗口区间的概率计算基于上一窗口区间的概率结果，分别计算出各个窗口区间各自对应的概率值。最后筛选概率值最高的窗口区间对应的命令词作为语音识别结果。本申请通过基于阈值的规则处理，有效保证了概率矩阵的数值稳定性。并采用概率累乘计算的方式替换log域计算，从而降低计算量。在窗口搜索的过程中，后一窗口区间的概率计算基于前一窗口区间的概率结果，从而减少重复计算的过程，进一步降低了计算量，有效加快了处理速度。加快了处理速度。加快了处理速度。

全部详细技术资料下载

【技术实现步骤摘要】
模型输出的后处理方法、装置和计算机设备

[0001]本申请涉及语音识别
，特别涉及一种模型输出的后处理方法、装置和计算机设备。

技术介绍

[0002]现有语音识别的后处理算法，是基于神经网络输出的概率矩阵，在概率矩阵的基础上进行最优路径的搜索。最优路径的搜索通常是采用概率累乘算法获取得到，但由于数值稳定性的考虑，一般采用logsum的方式进行处理（先把概率值转换为log值，概率值之间的乘法转换为log的加法），在计算完成后再转换为原先的概率值。
[0003]这种处理方法虽然可以带来数值稳定性的好处，但是由于引入了大量的log运算，导致在嵌入式等资源受限的设备上运用时，由于计算量过大导致计算耗时过长，严重影响算法的实时性。

技术实现思路

[0004]本申请的主要目的为提供一种模型输出的后处理方法、装置和计算机设备，旨在解决现有语音识别的后处理算法计算量大、计算耗时过长的弊端。
[0005]为实现上述目的，本申请提供了一种模型输出的后处理方法，包括：获取语音识别模型输出的概率矩阵；在所述概率矩阵中进行窗口搜索，在窗口搜索过程中，基于阈值对所述概率矩阵进行规则处理，剔除所述概率矩阵中的无效路径，并且所述概率矩阵的后一窗口区间的概率计算基于上一窗口区间的概率结果，分别计算出各个窗口区间各自对应的概率值；筛选所述概率值最高的窗口区间对应的命令词作为语音识别结果。
[0006]本申请还提供了一种模型输出的后处理装置，包括：获取模块，用于获取语音识别模型输出的概率矩阵；搜索模块，用于在...

【技术保护点】

【技术特征摘要】
1.一种模型输出的后处理方法，其特征在于，包括：获取语音识别模型输出的概率矩阵；在所述概率矩阵中进行窗口搜索，在窗口搜索过程中，基于阈值对所述概率矩阵进行规则处理，剔除所述概率矩阵中的无效路径，并且所述概率矩阵的后一窗口区间的概率计算基于上一窗口区间的概率结果，分别计算出各个窗口区间各自对应的概率值；筛选所述概率值最高的窗口区间对应的命令词作为语音识别结果。2.根据权利要求1所述的模型输出的后处理方法，其特征在于，所述基于阈值对所述概率矩阵进行规则处理，剔除所述概率矩阵中的无效路径的步骤中，所述无效路径的识别规则包括：调取第一阈值，并将所述概率矩阵中小于所述第一阈值的概率值替换为所述第一阈值；调取第二阈值，并获取第一路径中小于所述第二阈值的概率值的个数；若小于所述第二阈值的概率值的个数大于预设比例的所述第一路径的路径长度，则判定所述第一路径为所述无效路径。3.根据权利要求2所述的模型输出的后处理方法，其特征在于，所述概率矩阵的后一窗口区间的概率计算基于上一窗口区间的概率结果，分别计算出各个窗口区间各自对应的概率值的步骤，包括：在对所述概率矩阵中的第二路径做概率累乘计算的过程中，每得到一个概率累乘结果，则判断所述概率累乘结果是否小于所述第一阈值；若所述概率累乘结果小于所述第一阈值，则停止对所述第二路径做概率累乘计算，并将所述第二路径标定为无效路径。4.根据权利要求1所述的模型输出的后处理方法，其特征在于，所述概率矩阵的后一窗口区间的概率计算基于上一窗口区间的概率结果，分别计算出各个窗口区间各自对应的概率值的步骤中，单个所述窗口区间的每个位置的概率值的计算步骤包括：根据所述窗口搜索的左指针在窗口范围内遍历，计算所述窗口区间在所述窗口搜索的右指针首列的第一概率结果，其中，所述右指针的值与所述窗口搜索的窗口长度相同；将所述第一概率结果与所...

【专利技术属性】
技术研发人员：李杰，王广新，杨汉丹，
申请(专利权)人：深圳市友杰智新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人