命令词得分计算方法、装置、设备和介质制造方法及图纸

技术编号:41490616 阅读:34 留言:0更新日期:2024-05-30 14:36
本发明专利技术属于语音技术领域,公开了一种命令词得分计算方法、装置、设备和介质,其中,方法包括:将语音识别网络输出的结果进行缓存组成解矩阵;其中,解码矩阵的形状为TC,T表示时间长度,C等于音素类别数+1;1对应blank类别;根据解码矩阵构建用于计算预设命令词得分的矩阵,作为第一矩阵;第一矩阵的形状为TS,S等于预设命令词的长度+1;1对应blank类别;基于第一矩阵进行递推,对递推到的每一节点计算两个值,分别为到达此节点时是音素的总概和达到此节点时是blank的总概率;确定用于计算预设命令词得分的节点,将用于计算预设命令词得分的节点的两个值进行相加,获得预设命令词的得分。本发明专利技术能够减少可行路径的遗漏,提高命令词识别的准确率。

【技术实现步骤摘要】

本申请涉及语音,特别是涉及到一种命令词得分计算方法、装置、设备和介质


技术介绍

1、命令词识别属于语音识别,广泛应用于智能家居领域,比如智能语音音箱、智能语音耳机、智能语音灯、智能语音风扇等。嵌入式设备由于成本考虑,相比手机等智能设备,其算力低、内存和flash小。由于ctc解码算法具有对序列任务无需对齐、解码过程高效、节省内存等优势,一般的嵌入式设备上的语音识别算法一般采用ctc解码算法。一般的解码算法是按照前向算法计算路径得分,大致是去重和去blank,从而计算得到命令词得到。此方式的缺陷在于,比如,对于命令词“打开”对应的音素序列 d a k ai,按照现有的ctc解码方法,其可行的路径只能是d a _ _ k k ai或者是d _ _ a k k ai ,但是实际上d a _ a kk ai (此序列表征ctc解码矩阵每列的最大值对应的音素或blank(用_ 表示 )))这个路径也是可以的,而且此路径可能是主要路径,而由于ctc解码方法的去重和去blank规则,这条路径会被漏掉,由于多条路径可以映射为一个命令词,因此这也导致“打开”这个命令词的得本文档来自技高网...

【技术保护点】

1.一种命令词得分计算方法,其特征在于,所述方法包括:

2.根据权利要求1所述的命令词得分计算方法,其特征在于,所述语音识别网络每一时刻输出各音素的概率以及blank的概率,所述将语音识别网络输出的结果进行缓存,组成解码矩阵的步骤包括:按照时间先后顺序,将各时刻输出的blank的概率填充到第一空白矩阵的第一行,将各时刻输出的第一音素的概率填充到第一空白矩阵的第二行,将各时刻输出的第二音素的概率填充到第一空白矩阵的第三行,依次类推直到将各时刻输出的第C个音素的概率填充到第一空白矩阵的最后一行组成所述解码矩阵;其中,第一行是解码矩阵最上面的一行。

3.根据权利要求2所...

【技术特征摘要】

1.一种命令词得分计算方法,其特征在于,所述方法包括:

2.根据权利要求1所述的命令词得分计算方法,其特征在于,所述语音识别网络每一时刻输出各音素的概率以及blank的概率,所述将语音识别网络输出的结果进行缓存,组成解码矩阵的步骤包括:按照时间先后顺序,将各时刻输出的blank的概率填充到第一空白矩阵的第一行,将各时刻输出的第一音素的概率填充到第一空白矩阵的第二行,将各时刻输出的第二音素的概率填充到第一空白矩阵的第三行,依次类推直到将各时刻输出的第c个音素的概率填充到第一空白矩阵的最后一行组成所述解码矩阵;其中,第一行是解码矩阵最上面的一行。

3.根据权利要求2所述的命令词得分计算方法,其特征在于,所述根据所述解码矩阵构建用于计算预设命令词得分的矩阵的步骤包括:

4.根据权利要求3所述的命令词得分计算方法,其特征在于,所述确定用于计算所述预设命令词得分的节点的步骤包括:

5.根据权利要求3所述的命令词得分计算方法,其特征在于,当所述预设命令词对应的音素序列为abc,其中,a是音素序列abc的第一个音素,b是音素序列abc的第二个音素,c是音素序列的第三个音素,t=5时,递推时,当t=0时,可走blank 和a这两个节点,接下来,t=0时的blank节点可走t=1时blank 和a这两个节点,t=0时的a节点可走t=1时blank 、a和b这三个节点,接着,t=1时的blank节点可走t=2时blank 和a这两个节点,t=1时的a节点可走t=2时bla...

【专利技术属性】
技术研发人员:李杰
申请(专利权)人:深圳市友杰智新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1