【技术实现步骤摘要】
一种语音关键词识别方法、装置、系统及电子设备
[0001]本专利技术涉及语音关键词识别领域,尤其是一种语音关键词识别方法、装置、系统及电子设备。
技术介绍
[0002]语音识别技术是将连续的语音数据流转化为一段完整的文本或语义,关键词识别是语音识别的一个重要分支,其任务重点是判断语音信号中是否含有预设的关键词,可以在控制系统中作为常开开关,用于唤醒如智能终端、物联网设备、可穿戴设备、车机等各种电子设备,也可以在大量的音频数据中检索是否存在某些关键词。
[0003]近年来,随着人工智能技术的发展,基于神经网络的端到端的关键词识别系统逐渐成为主流,在识别性能方面取得了较大的进步。在这类关键词识别系统中,主要包括特征提取,神经网络识别分类和识别结果后处理三个主要部分。神经网络模型取代了传统的基于隐马尔可夫模型的解码系统,不需要进行解码以及音素的识别等过程,系统的鲁棒性与准确率均更有优势。
[0004]基于神经网络的端到端的关键词识别系统尽管在识别性能上优于传统算法,但是因其对计算量与存储空间需求大,难以被部署在电量 ...
【技术保护点】
【技术特征摘要】
1.一种语音关键词识别方法,其特征在于,包括:获取语音信号;通过MFCC特征提取模块根据所述语音信号得到频谱图,并从所述频谱图中提取包括时域信息和频域信息的特征矩阵;对所述特征矩阵进行分类识别;根据分类识别结果与经过预先训练的语音关键词识别模型获取所述语音信号中的关键词。2.根据权利要求1所述的一种语音关键词识别方法,其特征在于,所述通过MFCC特征提取模块根据所述语音信号得到频谱图,并从所述频谱图中提取包括时域信息和频域信息的特征矩阵,包括:通过MFCC特征提取模块中的预加重模块对所述语音信号移位与加减运算,得到预加重运算后的语音序列;通过所述MFCC特征提取模块中的快速傅里叶变换模块以逐级迭代的形式对所述语音序列进行快速傅里叶变换的运算,得到频谱图;通过所述MFCC特征提取模块中的梅尔滤波模块对所述频谱图进行梅尔滤波,得到梅尔频谱;通过所述MFCC特征提取模块中的对数模块将所述梅尔频谱转换为所述特征矩阵。3.根据权利要求1所述的一种语音关键词识别方法,其特征在于,所述根据分类识别结果与经过预先训练的语音关键词识别模型获取所述语音信号中的关键词,包括:根据所述分类识别结果,并通过神经网络加速器中的运算阵列以逐层卷积和逐点卷积且以迭代的网络执行所述语音关键词识别模型的各层运算,得到所述语音信号中的关键词。4.一种语音关键词识别装置,其特征在于,包括:语音信号获取单元,用于获取语音信号;特征矩阵提取单元,用于通过MFCC特征提取模块根据所述语音信号得到频谱图,并从所述频谱图中提取包括时域信息和频域信息的特征矩阵;分别识别单元,用于对所述特征矩阵进行分类识别;关键词识别单元,用于根据分类识别结果与经过预先训练的语音关键词识别模型获取所述语音信号中的关键词。5.一种语音关键词识别系统,其特征在于,包括:控制逻辑模块,用于控制和切换所述系统中的各模块运行状态;参数载入接口模块,用于传输所述系统中的片上缓存和片外缓存的数据,以及从外部载入经过预先训练的语音关键词识别模型的参数与配置指令;MFCC特征提取模块,用于从语音信号中提取包括时域信息和频域信息的特征矩阵;异步FIFO模块,用于缓存所述特征矩阵,以及将所述特征矩阵输出至神经网络加速器;神经网络加速器,用于对所述特征矩阵进行分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。