一种多人命令语音识别方法、系统及存储介质技术方案

技术编号：19697502 阅读：23 留言：0更新日期：2018-12-08 12:39

本发明专利技术公开了一种多人命令语音识别方法，包括：获取至少一个用户语音指令；根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在；根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在；将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配，得到与至少一个用户对应的至少一个响应指令；对所述至少一个响应指令根据响应策略进行匹配响应。本发明专利技术通过用户的声纹特征分别识别多个用户的唤醒词与执行命令，并按照响应策略进行响应，唤醒词与执行命令分开识别，提高了语音识别精度，按响应策略执行用户的语音命令，还可使语音命令清晰的得到执行，不会混乱。

全部详细技术资料下载

【技术实现步骤摘要】
一种多人命令语音识别方法、系统及存储介质
本专利技术语音识别领域，尤其涉及一种多人命令语音识别方法、系统及存储介质。
技术介绍
语音识别技术是指机器把音频输入转换为文字或命令的技术。在语音识别过程中，尤其是麦克风阵列具有远场识别功能时，音频信号采集的灵敏度会比较高。用户周围如果有其他不相干的人说话，麦克风会同时采集到多个人的声音，而且不相关部分的声音幅值也会高于语音识别门限，导致用户与设备的交互以及周围其他人之间的闲聊均被设备采集，使语音识别模块无法判断用户的意图，从而难以做出正确的响应。传统的音频信号处理方法有麦克风降噪，回声消除，主要是用来去除环境中喇叭或者设备产生的噪声；还有自动增益控制技术，主要用来稳定音频信号。但对于嘈杂环境中多人讲话时，却无法提升语音识别效果。随着社会与科学技术的高速发展，人机交互技术发展成为一门重要技术，应用于智能机器人及智能手机等智能设置的人机交互，需要语音识别技术做为人机交互的基础，而在现有的人机交互中，都是对智能设备进行单独命令，语音识别也是单人语音识别，识别的精度并不高，在智能设备上的响应也只能进行单人响应，一次响应完毕后再对语音进行识别，才能再次响应，无法针对多个用户同时命令做出连续的响应。
技术实现思路
本专利技术的目的是针对上述现有技术存在的缺陷，提供一种多人命令语音识别方法、系统及存储介质。本专利技术采用的技术方案是，提供一种多人命令语音识别方法，包括：智能音箱通过采音设备获取至少一个用户语音指令；根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在；根据用户声纹特征识别检测所述至少一个用户语音指...

【技术保护点】
1.一种多人命令语音识别方法，所述方法用于智能音箱，其特征在于，包括：智能音箱通过采音设备获取至少一个用户语音指令；根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在；根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在；将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配，得到与至少一个用户对应的至少一个响应指令；智能音箱对所述至少一个响应指令根据响应策略进行匹配响应。

【技术特征摘要】
1.一种多人命令语音识别方法，所述方法用于智能音箱，其特征在于，包括：智能音箱通过采音设备获取至少一个用户语音指令；根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在；根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在；将所述至少一个唤醒词与所述至少一个执行命令按用户声纹特征进行匹配，得到与至少一个用户对应的至少一个响应指令；智能音箱对所述至少一个响应指令根据响应策略进行匹配响应。2.如权利要求1所述的多人命令语音识别方法，其特征在于，在根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在之前，所述方法还包括：智能音箱通过采音设备采集至少一个用户声纹特征；将采集到的所述至少一个用户声纹特征配置为存储有至少一个用户声纹特征的声纹库，所述声纹库对应一个用户表；所述声纹库分区配置，分别配置为存储所述至少一个用户的唤醒词声纹特征区与执行命令声纹特征区。3.如权利要求2所述的多人命令语音识别方法，其特征在于，所述方法还包括：在所述采集至少一个用户声纹特征、及所述获取至少一个用户语音指令时进行第一去噪处理；在所述根据用户声纹特征识别检测所述至少一个用户语音指令中至少一个唤醒词的存在、及在所述根据用户声纹特征识别检测所述至少一个用户语音指令中的至少一个执行命令的存在时进行第二去噪处理。4.如权利要求1所述的多人命令语音识别方法，其特征在于，所述方法在所述对所述至少一个响应指令根据响应策略进行匹配响应前还包括：确定响应优先级；根据所述确定响应优先级配置一用户权限表。5.如权利要求4所述的多人命令语音识别方法，其特征在于，所述对所述至少一个响应指令根据响应策略进行匹配响应的方法包括：根据用户声纹特征将响应指令映射到用户表；检测用户的响应优先级；按用户的响应优先级进行输出。6.一种多人命令语音识别系统，其特征在于，包括：输入模块，用于获取至少一个用户语音指...

【专利技术属性】
技术研发人员：蔡洁荣，
申请(专利权)人：福来宝电子深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人