基于命令词识别的语音控制方法、装置、设备及存储介质制造方法及图纸

技术编号:40540913 阅读:16 留言:0更新日期:2024-03-05 18:56
本申请公开了一种基于命令词识别的语音控制方法、装置、设备及存储介质,涉及语音识别技术领域。本申请提供的技术方案包括:从当前输入的语音信息中获取待识别音频数据;将待识别音频数据输入预先训练的命令词识别模型中,得到命令词识别模型输出的命令词结果;命令词识别模型基于训练样本集进行训练得到,训练过程中采用中心损失函数和聚焦损失函数;根据命令词结果,确定语音信息触发的操作指令。通过上述技术手段,以通过普通样本训练模型也可以达到优化模型性能的训练效果,保证模型在复杂语音场景的识别准确率的同时提高模型训练效率,以解决现有技术中模型训练效率低的问题。

【技术实现步骤摘要】

本申请涉及语音识别,尤其涉及一种基于命令词识别的语音控制方法、装置、设备及存储介质


技术介绍

1、命令词识别是语音识别技术的重要方向之一,其一般应用于终端设备的控制或唤醒。命令词识别模型在输入语音较为复杂的情况下,命令词识别模型会出现误识别现象。误识别现象一般包括非命令词误识别为命令词,不同含义的命令词之间的误识别,命令词误识别为非命令词。

2、在现有技术中为避免命令词识别模型出现误识别现象,在命令词识别模型训练时可将损失函数设置为最小化同分类距离与最大化不同分类距离。该损失函数配合距离普通样本较远的正样本和距离普通样本较近的负样本的精选三元组,可有效提高模型在复杂语音场景下的识别准确率。但由于精选三元组的收集过程较为麻烦,需要较长时间才能收集到用于训练模型的样本数据,导致模型的训练效率较低。


技术实现思路

1、本申请提供一种基于命令词识别的语音控制方法、装置、设备及存储介质,以通过普通样本训练模型也可以达到优化模型性能的训练效果,保证模型在复杂语音场景的识别准确率的同时提高模型训练效率,以解决本文档来自技高网...

【技术保护点】

1.一种基于命令词识别的语音控制方法,其特征在于,包括:

2.根据权利要求1所述的基于命令词识别的语音控制方法,其特征在于,所述命令词识别模型由神经网络、池化层和线性变换层串联组成;

3.根据权利要求1所述的基于命令词识别的语音控制方法,其特征在于,所述命令词识别模型通过如下步骤训练得到:

4.根据权利要求3所述的基于命令词识别的语音控制方法,其特征在于,所述根据所述第一损失值和所述第二损失值,调整所述中心特征参数和所述第一神经网络模型的模型参数,包括:

5.根据权利要求3所述的基于命令词识别的语音控制方法,其特征在于,所述基于聚焦中心损失...

【技术特征摘要】

1.一种基于命令词识别的语音控制方法,其特征在于,包括:

2.根据权利要求1所述的基于命令词识别的语音控制方法,其特征在于,所述命令词识别模型由神经网络、池化层和线性变换层串联组成;

3.根据权利要求1所述的基于命令词识别的语音控制方法,其特征在于,所述命令词识别模型通过如下步骤训练得到:

4.根据权利要求3所述的基于命令词识别的语音控制方法,其特征在于,所述根据所述第一损失值和所述第二损失值,调整所述中心特征参数和所述第一神经网络模型的模型参数,包括:

5.根据权利要求3所述的基于命令词识别的语音控制方法,其特征在于,所述基于聚焦中心损失函数,根据各个所述样本音频数据的第二特征参数和各个命令词类别的中心特征参数,确定第二损失值,包括:

6.根据权利要求5所述的基于命令词识别的语音控制方法,其特征在于,所述基于所述聚焦损失函数,根据所述样本音频数据的第二特征参数和各个命令词类别的中心特征参数,确定所述第四损失值的权重系数,包括:

7.根据权利要求4所...

【专利技术属性】
技术研发人员:叶珑雷延强
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1