一种多人命令语音识别方法、系统及存储介质技术方案

技术编号:19697502 阅读:23 留言:0更新日期:2018-12-08 12:39
本发明专利技术公开了一种多人命令语音识别方法,包括:获取至少一个用户语音指令;根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在;根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在;将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配,得到与至少一个用户对应的至少一个响应指令;对所述至少一个响应指令根据响应策略进行匹配响应。本发明专利技术通过用户的声纹特征分别识别多个用户的唤醒词与执行命令,并按照响应策略进行响应,唤醒词与执行命令分开识别,提高了语音识别精度,按响应策略执行用户的语音命令,还可使语音命令清晰的得到执行,不会混乱。

【技术实现步骤摘要】
一种多人命令语音识别方法、系统及存储介质
本专利技术语音识别领域,尤其涉及一种多人命令语音识别方法、系统及存储介质。
技术介绍
语音识别技术是指机器把音频输入转换为文字或命令的技术。在语音识别过程中,尤其是麦克风阵列具有远场识别功能时,音频信号采集的灵敏度会比较高。用户周围如果有其他不相干的人说话,麦克风会同时采集到多个人的声音,而且不相关部分的声音幅值也会高于语音识别门限,导致用户与设备的交互以及周围其他人之间的闲聊均被设备采集,使语音识别模块无法判断用户的意图,从而难以做出正确的响应。传统的音频信号处理方法有麦克风降噪,回声消除,主要是用来去除环境中喇叭或者设备产生的噪声;还有自动增益控制技术,主要用来稳定音频信号。但对于嘈杂环境中多人讲话时,却无法提升语音识别效果。随着社会与科学技术的高速发展,人机交互技术发展成为一门重要技术,应用于智能机器人及智能手机等智能设置的人机交互,需要语音识别技术做为人机交互的基础,而在现有的人机交互中,都是对智能设备进行单独命令,语音识别也是单人语音识别,识别的精度并不高,在智能设备上的响应也只能进行单人响应,一次响应完毕后再对语音进行识别,才能再次响应,无法针对多个用户同时命令做出连续的响应。
技术实现思路
本专利技术的目的是针对上述现有技术存在的缺陷,提供一种多人命令语音识别方法、系统及存储介质。本专利技术采用的技术方案是,提供一种多人命令语音识别方法,包括:智能音箱通过采音设备获取至少一个用户语音指令;根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在;根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在;将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配,得到与至少一个用户对应的至少一个响应指令;智能音箱对所述至少一个响应指令根据响应策略进行匹配响应。优选的,在根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在之前,所述方法还包括:智能音箱通过采音设备采集至少一个用户声纹特征;将采集到的所述至少一个用户声纹特征配置为存储有至少一个用户声纹特征的声纹库,所述声纹库对应一个用户表;所述声纹库分区配置,分别配置为存储所述至少一个用户的唤醒词声纹特征区与执行命令声纹特征区。在使用用户声纹特征进行识别前,应对用户的声纹进行记录,以用于在识别时对用户的声纹进行匹配。优选的,所述方法还包括:在所述采集至少一个用户声纹特征、及所述获取至少一个用户语音指令时进行第一去噪处理;在所述根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在、及在所述根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在时进行第二去噪处理。采集或获取到的声音因环境的影响,会在用户的声音中参杂噪声,而在识别多用户的语音的情况下,噪声对于识别的结果影响更大,会造成识别精度下降甚至无法识别的情况。优选的,所述方法在所述对所述至少一个响应指令根据响应策略进行匹配响应前还包括:确定响应优先级;根据所述确定响应优先级配置一用户权限表。当存在多个用户语音命令时,不能实现同时响应,应当确定响应的优先级,按照优先级进行响应,才能在更好的完成响应,所述用户权限表记录用户的优先级情况。优选的,所述对所述至少一个响应指令根据响应策略进行匹配响应的方法包括:根据用户声纹特征将响应指令映射到用户表;检测用户的响应优先级;按用户的响应优先级进行输出。通过用户声纹特征将响应指令映射到用户表,为所述用户表临时赋予一个响应指令,在判断优先级后,可调用用户表的响应指令直接进行输出。还提供一种多人命令语音识别系统,包括:输入模块,用于获取至少一个用户语音指令;语音识别模块,用于根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个唤醒词的存在;还用于根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在;指令生成模块,用于将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配,得到与至少一个用户对应的至少一个响应指令;检测模块,用于检测用户优先级;响应模块,用于对所述至少一个响应指令根据响应策略进行匹配响应。优选的,所述输入模块还用于采集至少一个用户声纹特征,所述系统还包括:存储子模块,用于将采集到的所述至少一个用户声纹特征配置为存储有至少一个用户声纹特征的声纹库,所述声纹库对应一个用户表;所述存储子模块设置有第一存储区用于配置为存储所述至少一个用户的唤醒词声纹特征区,以及第二存储区用于配置为存储所述执行命令声纹特征区。所述唤醒词声纹特征区与所述执行命令声纹特征区分开设置,在对唤醒词进行识别时,只需要调用所述唤醒词声纹特征区的识别程序,在对执行命令进行识别时,只需要调用所述执行命令声纹特征区的识别程序,缩小的识别的范围。优选的,所述输入模块内设置有第一去噪子模块,用于在所述采集至少一个用户声纹特征、及所述获取至少一个用户语音指令时进行第一去噪处理;所述语音识别模块内设置有第二去噪子模块,用于在所述根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在、及所述根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在前进行第二去噪处理。采集或获取到的声音因环境的影响,会在用户的声音中参杂噪声,而在识别多用户的语音的情况下,噪声对于识别的结果影响更大,会造成识别精度下降甚至无法识别的情况。所述第一去噪子模块对所述输入模块进行第一去噪处理,所述第二去噪子模块对所述语音识别模块进行第二去噪处理,进一步的减少环境噪声带来的对用户语音的影响,提高了语音识别的精度。优选的,所述系统还包括指令输出子模块,用于向用户输出响应指令。所述存储子模块内还包括:一映射表用于根据用户声纹特征将响应指令映射到用户表,以及一用户权限表用于确定响应优先级。当存在多个用户语音命令时,所述响应模块不能实现同时响应,应当确定响应的优先级,所述响应模块按照优先级进行响应,才能在更好的完成响应,所述用户权限表记录用户的优先级情况,通过用户声纹特征将响应指令映射到用户表,为所述用户表临时赋予一个响应指令,在判断优先级后,可调用用户表的响应指令直接进行输出。还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如前述的多人命令语音识别方法。与现有技术相比,本专利技术至少具有以下有益效果:本专利技术通过用户的声纹特征分别识别多个用户的唤醒词与执行命令,并按照响应策略进行响应,唤醒词与执行命令分开识别,提高了语音识别精度,按响应策略执行用户的语音命令,还可使语音命令清晰的得到执行,不会混乱。附图说明图1为本专利技术实施例的方法流程图;图2为本专利技术实施例的声纹库配置方法流程图;图3为本专利技术实施例的用户权限表配置方法流程图;图4为本专利技术实施例的响应策略方法流程图;图5为本专利技术实施例的系统模块示意图。具体实施方式下面结合附图和实施例对本专利技术做进一步说明。如图1所示,本专利技术提出了一种多人命令语音识别方法,设定所述方法的实施环境,所述实施环境包括:响应终端,所述响应终端为智能设备包括并不限于:智能音箱、智能手机、本文档来自技高网...

【技术保护点】
1.一种多人命令语音识别方法,所述方法用于智能音箱,其特征在于,包括:智能音箱通过采音设备获取至少一个用户语音指令;根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在;根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在;将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配,得到与至少一个用户对应的至少一个响应指令;智能音箱对所述至少一个响应指令根据响应策略进行匹配响应。

【技术特征摘要】
1.一种多人命令语音识别方法,所述方法用于智能音箱,其特征在于,包括:智能音箱通过采音设备获取至少一个用户语音指令;根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在;根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在;将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配,得到与至少一个用户对应的至少一个响应指令;智能音箱对所述至少一个响应指令根据响应策略进行匹配响应。2.如权利要求1所述的多人命令语音识别方法,其特征在于,在根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在之前,所述方法还包括:智能音箱通过采音设备采集至少一个用户声纹特征;将采集到的所述至少一个用户声纹特征配置为存储有至少一个用户声纹特征的声纹库,所述声纹库对应一个用户表;所述声纹库分区配置,分别配置为存储所述至少一个用户的唤醒词声纹特征区与执行命令声纹特征区。3.如权利要求2所述的多人命令语音识别方法,其特征在于,所述方法还包括:在所述采集至少一个用户声纹特征、及所述获取至少一个用户语音指令时进行第一去噪处理;在所述根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在、及在所述根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在时进行第二去噪处理。4.如权利要求1所述的多人命令语音识别方法,其特征在于,所述方法在所述对所述至少一个响应指令根据响应策略进行匹配响应前还包括:确定响应优先级;根据所述确定响应优先级配置一用户权限表。5.如权利要求4所述的多人命令语音识别方法,其特征在于,所述对所述至少一个响应指令根据响应策略进行匹配响应的方法包括:根据用户声纹特征将响应指令映射到用户表;检测用户的响应优先级;按用户的响应优先级进行输出。6.一种多人命令语音识别系统,其特征在于,包括:输入模块,用于获取至少一个用户语音指...

【专利技术属性】
技术研发人员:蔡洁荣
申请(专利权)人:福来宝电子深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1