The invention is applicable to the field of speech recognition technology, provides a voice command recognition method, system and robot, including obtaining the real-time voice data of TV live television, and extract the first voiceprint data real-time voice data in real-time TV; a preset first voiceprint data cache recently period of time; collection of environmental voice data. Second data and extract the voice data in the voice environment; if the real-time cache first voiceprint data and second voice data do not match, then the user voice command recognition of voice data. Through the real-time data cache second recently a preset first voiceprint voice data period of the voiceprint matching, judge the environment voice data is not a TV speech, to avoid false television sounds as a user voice commands, so even with TV voice environment, also can correctly identify the user's voice commands to prevent interference, TV signal.
【技术实现步骤摘要】
一种语音指令识别方法、系统及机器人
本专利技术属于语音识别
,尤其涉及一种语音指令识别方法、系统及机器人。
技术介绍
随着人们生活水平的提高以及机器人技术的进步,机器人已经逐步走入了普通家庭的视野,如市面上常见的除草机器人、清洁机器人及管家机器人等。随着语音识别技术的发展与普及,现在市面上许多机器人都具备了语音识别及语义识别功能,用户可以通过直接与机器人语音对话的形式,来与机器人进行交互,控制机器人工作。目前的语音识别技术能做到安静的环境之下,较好的接收和识别用户语音指令,与用户进行交互,但一旦环境中出现了人声噪声时,如看观看电视节目时发出的电视语音,语音识别系统就会无法分辨出是电视语音还是用户语音指令,导致执行一些错误的操作,例如:如电视中发出“关机”的语音,语音识别系统将其识别为用户语音指令,导致控制机器人关机。综上可知,现有技术难以区分用户语音指令及电视语音,无法在含有电视语音的环境中,正确地识别出用户语音指令。
技术实现思路
有鉴于此,本专利技术实施例提供了语音指令识别方法及装置,以解决现有技术中无法在含有电视语音的环境中,正确识别出用户语音指令的问题。本专利技术实施例的第一方面提供了一种语音指令识别方法,包括:获取电视直播时的实时电视语音数据,并提取所述实时电视语音数据中的第一声纹数据;实时缓存最近一预设时间段内的所述第一声纹数据;采集环境语音数据,并提取所述环境语音数据中的第二声纹数据;若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配,则对所述环境语音数据进行用户语音指令识别。本专利技术实施例的第二方面提供了一种语音指令识别系统,包括:机 ...
【技术保护点】
一种语音指令识别方法,其特征在于,包括:获取电视直播时的实时电视语音数据,并提取所述实时电视语音数据中的第一声纹数据;实时缓存最近一预设时间段内的所述第一声纹数据;采集环境语音数据,并提取所述环境语音数据中的第二声纹数据;若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配,则对所述环境语音数据进行用户语音指令识别。
【技术特征摘要】
1.一种语音指令识别方法,其特征在于,包括:获取电视直播时的实时电视语音数据,并提取所述实时电视语音数据中的第一声纹数据;实时缓存最近一预设时间段内的所述第一声纹数据;采集环境语音数据,并提取所述环境语音数据中的第二声纹数据;若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配,则对所述环境语音数据进行用户语音指令识别。2.如权利要求1所述的语音指令识别方法,其特征在于,所述提取所述环境语音数据中的第二声纹数据,包括:对所述环境语音数据进行滤波降噪处理,得到人声数据;提取所述人声数据中的所述第二声纹数据。3.如权利要求1所述的语音指令识别方法,其特征在于,所述若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配,则对所述环境语音数据进行用户语音指令识别,包括:所述若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配,对所述环境语音数据进行语音识别,得到所述环境语音数据对应的环境语音指令;将所述环境语音指令与预设的干扰语音指令库进行匹配;若所述环境语音指令与所述干扰语音指令库不匹配,则对所述环境语音数据进行用户语音指令识别。4.如权利要求1或2所述的语音指令识别方法,其特征在于:提取语音数据的MFCC梅尔倒谱系数作为声纹数据,所述语音数据包括所述环境语音数据及所述人声数据。5.一种语音指令识别系统,其特征在于,包括:机器人及服务器;所述服务器包括电视声纹获取模块,用于获取电视直播时的实时电视语音数据,并提取所述实时电视语音数据中的第一声纹数据;实时缓存最近一预设时间段内的所述第一声纹数据;所述机器人包括环境声纹采集模块,用于采集环境语音数据,并提取所述环境语音数据中的第二声纹数据,并将第二声纹数据发送至所述服务器;所述服务器包括声纹匹配模块,用于对所述第一声纹数据与所述第二声纹数据进行...
【专利技术属性】
技术研发人员:韦锦靓,邢学强,
申请(专利权)人:深圳市搜果科技发展有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。