多模型语音命令词的识别方法、系统、设备及储存介质技术方案

技术编号:37703601 阅读:34 留言:0更新日期:2023-06-01 23:50
本发明专利技术公开了多模型语音命令词的识别方法、系统、设备及储存介质,该识别方法包括如下步骤:基于需要支持的语音命令词划分后构建相应数量的模型以及各个模型支持的命令词;根据划分的结果得出系统运行时需要并行的模型最大数量,根据模型的最大数量创建线程池,加载需要运行的模型,每个模型从线程池中分配一个单独的线程;主线程对音频输入进行特征提取及公共部分的计算,其余的多个线程分别由对应模型的神经网络进行计算;当只有一个模型识别到命令词时,对误识别做过滤得到最终识别结果;当多个模型同一时间检测到命令词时,根据命令词的得分最高的作为最终的识别结果;本发明专利技术通过以命令词建的模型对语音命令词进行快速精准识别。准识别。准识别。

【技术实现步骤摘要】
多模型语音命令词的识别方法、系统、设备及储存介质


[0001]本专利技术涉及语音识别领域,尤其涉及一种多模型语音命令词的识别方法、系统、设备及储存介质。

技术介绍

[0002]命令词识别技术使得机器对语音指令进行识别和理解的人工只能技术。命令词识别技术已经广泛用在我们的生活当中,智能家居,穿戴设备,智能车载系统等等。
[0003]传统的命令词识别技术需要语音端点检测(vad)后通过声学建模,wfst解码得到识别的内容,只能对命令词进行精准识别,命令词的前后如果有人声干扰或者说话人说的其他语音识别的性能会下降很多,虽然可以使用在建立wfst时前后加入filler来对额外的语音进行吸收,但是实际使用时会造成大量误识别的出现,同时这种解码识别需要加载包含所有命令词的模型,只能在一个CPU上运行,无法多核并行。

技术实现思路

[0004]本专利技术目的是为了克服现有技术的不足而提供一种以命令词进行建模,然后通过模型对语音命令词进行识别,最后得到语音识别的结果快速且精准,同时能在不损失识别性能的前提下增加命令词的数量的多模型语音命本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多模型语音命令词的识别方法,其特征在于,包括如下步骤:基于需要支持的语音命令词划分后构建相应数量的模型以及各个模型支持的命令词;根据划分的结果得出系统运行时需要并行的模型最大数量,根据模型的最大数量创建线程池,加载需要运行的模型,每个模型从线程池中分配一个单独的线程;主线程对音频输入进行特征提取及公共部分的计算,其余的多个线程分别由对应模型的神经网络进行计算;当只有一个模型识别到命令词时,对误识别做过滤得到最终识别结果;当多个模型同一时间检测到命令词时,根据命令词的得分最高的作为最终的识别结果。2.如权利要求1所述的多模型语音命令词的识别方法,其特征在于:语音命令词按照功能或者类别和命令词的长度进行划分。3.如权利要求1所述的多模型语音命令词的识别方法,其特征在于:每个模型的命令词个数不超过10个。4.如权利要求1所述的多模型语音命令词的识别方法,其特征在于,命令词的得分的计算方式如下:其中,N是选中命令词片段的帧数,C
h
代表选中的命令词片段的集合,P(c|w)是某一命令词的概率即神经网络对应节点的输出,P(b|w)是非命令词的概率。5.如权利要求2所述的多模型语音命令词的识别方法,其特征在于:对不同的模型设置不同的长度限制,由于相近长度的命令词分在了一组,当选中的命令词片段的时长未达到设置的长度时将其认为是误识别...

【专利技术属性】
技术研发人员:马殿昌王欢良唐浩元肖佳林谢勇张李
申请(专利权)人:苏州奇梦者科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1