关键词检测方法、电子设备和存储介质技术

技术编号:37496461 阅读:29 留言:0更新日期:2023-05-07 09:33
本发明专利技术公开关键词检测方法、电子设备和存储介质,其中,关键词检测方法用于关键词检测系统,关键词检测系统包括预训练的声学模型、注意力模块和触发模块,方法包括:利用所述预训练的声学模型处理音频输入得到帧级声学特征;利用所述注意力模块在所述声学特征和关键词的文本信息进行交互以判定所述关键词的中的每个音素是否在所述帧级声学特征中被发现并输出判定结果;利用所述触发模块根据所述判定结果确定最终唤醒状态。通过在关键词检测系统中引入预训练的声学模型、注意力模块和触发模块,可以提供一种流式可定制的关键词发现方法,注意力模块的搜索过程与声学模型解耦,从而不用依赖声学模型,可以很容易地扩展到不同的声学模型。的声学模型。的声学模型。

【技术实现步骤摘要】
关键词检测方法、电子设备和存储介质


[0001]本专利技术属于关键词检测
,尤其涉及关键词检测方法、电子设备和存储介质。

技术介绍

[0002]相关技术中,智能家电和语音助手的部署越来越广泛。关键词发现(也被称为唤醒词检测或语音触发)模块作为前沿组件之一,应该在听到唤醒词时快速而准确地触发后续模块。因此,关键词识别系统的准确性和延迟性对用户体验至关重要。
[0003]关键词识别任务要求模型在有限的计算能力下在连续的语音流中发现关键词。传统的关键词识别框架是一个深度神经网络(DNN),具有独特的非神经搜索方法。根据对隐马尔可夫模型(HMM)的依赖程度,这些方法可以分为基于HMM的方法和无HMM的方法。基于HMM的方法是在DNN的基础上增加了一个HMM,该HMM将音频输入定性为关键词和填充物。伴随着深度学习的成功,一些工作被提出来,在没有HMM的DNN上建立无HMM系统,直接预测关键词或关键词的子词标记。这些方法一般由一个声学模型和一个后处理模块组成。声学模型的结构有卷积神经网络(CNN)、递归神经网络(RNN)、注意机制和其他复合网本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关键词检测方法,用于关键词检测系统,其中,所述关键词检测系统包括预训练的声学模型、注意力模块和触发模块,所述方法包括:利用所述预训练的声学模型处理音频输入得到帧级声学特征;利用所述注意力模块在所述声学特征和关键词的文本信息进行交互以判定所述关键词的中的每个音素是否在所述帧级声学特征中被发现并输出判定结果;利用所述触发模块根据所述判定结果确定最终唤醒状态。2.根据权利要求1所述的方法,其中,所述预训练的声学模型使用音素作为识别符号,并通过帧级对齐的标签进行训练,训练完成后,冻结所述预训练的声学模型的所有参数。3.根据权利要求2所述的方法,其中,所述利用所述注意力模块在所述声学特征和关键词的文本信息进行交互以判定所述关键词的中的每个音素是否在所述帧级声学特征中被发现并输出判定结果包括:使用双向长短时记忆力模块处理所述关键词的音素序列,将所述双向长短时记忆力模块的最后的隐藏状态作为所述关键词的单词嵌入;将所述单词嵌入和所述帧级声学特征通过交叉注意力机制进行判定并输出判定结果,其中,所述判定结果包括所述帧级声学特征中每一帧的注意力得分和所述帧级声学特征中每一帧输出。4.根据权利要求2所述的方法,其中,所述触发模块采用多标签构建机制对所述关键词的音素序列的长度和触发阶段的多标签...

【专利技术属性】
技术研发人员:俞凯郭嘉祺杨宝琛奚彧
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1