一种语音指令识别方法、系统及机器人技术方案

技术编号：16459180 阅读：36 留言：0更新日期：2017-10-25 23:44

本发明专利技术适用于语音识别技术领域，提供了一种语音指令识别方法、系统及机器人，包括：获取电视直播时的实时电视语音数据，并提取实时电视语音数据中的第一声纹数据；实时缓存最近一预设时间段内的第一声纹数据；采集环境语音数据，并提取环境语音数据中的第二声纹数据；若实时缓存的第一声纹数据与第二声纹数据不匹配，则对环境语音数据进行用户语音指令识别。通过将第二声纹数据实时缓存最近一预设时间段内的第一声纹数据进行声纹匹配，判断环境语音数据是不是电视语音，避免了误将电视语音当作用户语音指令情况的发生，使得即使在含有电视语音的环境中，也能正确地识别出用户语音指令，防止电视语音信号的干扰。

A speech instruction recognition method, system and robot

The invention is applicable to the field of speech recognition technology, provides a voice command recognition method, system and robot, including obtaining the real-time voice data of TV live television, and extract the first voiceprint data real-time voice data in real-time TV; a preset first voiceprint data cache recently period of time; collection of environmental voice data. Second data and extract the voice data in the voice environment; if the real-time cache first voiceprint data and second voice data do not match, then the user voice command recognition of voice data. Through the real-time data cache second recently a preset first voiceprint voice data period of the voiceprint matching, judge the environment voice data is not a TV speech, to avoid false television sounds as a user voice commands, so even with TV voice environment, also can correctly identify the user's voice commands to prevent interference, TV signal.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音指令识别方法、系统及机器人
本专利技术属于语音识别
，尤其涉及一种语音指令识别方法、系统及机器人。
技术介绍
随着人们生活水平的提高以及机器人技术的进步，机器人已经逐步走入了普通家庭的视野，如市面上常见的除草机器人、清洁机器人及管家机器人等。随着语音识别技术的发展与普及，现在市面上许多机器人都具备了语音识别及语义识别功能，用户可以通过直接与机器人语音对话的形式，来与机器人进行交互，控制机器人工作。目前的语音识别技术能做到安静的环境之下，较好的接收和识别用户语音指令，与用户进行交互，但一旦环境中出现了人声噪声时，如看观看电视节目时发出的电视语音，语音识别系统就会无法分辨出是电视语音还是用户语音指令，导致执行一些错误的操作，例如：如电视中发出“关机”的语音，语音识别系统将其识别为用户语音指令，导致控制机器人关机。综上可知，现有技术难以区分用户语音指令及电视语音，无法在含有电视语音的环境中，正确地识别出用户语音指令。
技术实现思路
有鉴于此，本专利技术实施例提供了语音指令识别方法及装置，以解决现有技术中无法在含有电视语音的环境中，正确识别出用户语音指令的问题。本专利技术实施例的第一方面提供了一种语音指令识别方法，包括：获取电视直播时的实时电视语音数据，并提取所述实时电视语音数据中的第一声纹数据；实时缓存最近一预设时间段内的所述第一声纹数据；采集环境语音数据，并提取所述环境语音数据中的第二声纹数据；若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配，则对所述环境语音数据进行用户语音指令识别。本专利技术实施例的第二方面提供了一种语音指令识别系统，包括：机...
一种语音指令识别方法、系统及机器人

【技术保护点】
一种语音指令识别方法，其特征在于，包括：获取电视直播时的实时电视语音数据，并提取所述实时电视语音数据中的第一声纹数据；实时缓存最近一预设时间段内的所述第一声纹数据；采集环境语音数据，并提取所述环境语音数据中的第二声纹数据；若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配，则对所述环境语音数据进行用户语音指令识别。

【技术特征摘要】
1.一种语音指令识别方法，其特征在于，包括：获取电视直播时的实时电视语音数据，并提取所述实时电视语音数据中的第一声纹数据；实时缓存最近一预设时间段内的所述第一声纹数据；采集环境语音数据，并提取所述环境语音数据中的第二声纹数据；若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配，则对所述环境语音数据进行用户语音指令识别。2.如权利要求1所述的语音指令识别方法，其特征在于，所述提取所述环境语音数据中的第二声纹数据，包括：对所述环境语音数据进行滤波降噪处理，得到人声数据；提取所述人声数据中的所述第二声纹数据。3.如权利要求1所述的语音指令识别方法，其特征在于，所述若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配，则对所述环境语音数据进行用户语音指令识别，包括：所述若实时缓存的所述第一声纹数据与所述第二声纹数据不匹配，对所述环境语音数据进行语音识别，得到所述环境语音数据对应的环境语音指令；将所述环境语音指令与预设的干扰语音指令库进行匹配；若所述环境语音指令与所述干扰语音指令库不匹配，则对所述环境语音数据进行用户语音指令识别。4.如权利要求1或2所述的语音指令识别方法，其特征在于：提取语音数据的MFCC梅尔倒谱系数作为声纹数据，所述语音数据包括所述环境语音数据及所述人声数据。5.一种语音指令识别系统，其特征在于，包括：机器人及服务器；所述服务器包括电视声纹获取模块，用于获取电视直播时的实时电视语音数据，并提取所述实时电视语音数据中的第一声纹数据；实时缓存最近一预设时间段内的所述第一声纹数据；所述机器人包括环境声纹采集模块，用于采集环境语音数据，并提取所述环境语音数据中的第二声纹数据，并将第二声纹数据发送至所述服务器；所述服务器包括声纹匹配模块，用于对所述第一声纹数据与所述第二声纹数据进行...

【专利技术属性】
技术研发人员：韦锦靓，邢学强，
申请(专利权)人：深圳市搜果科技发展有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人