一种多媒体设备语音控制系统及方法技术方案

技术编号：8367209 阅读：425 留言：0更新日期：2013-02-28 06:33

本发明专利技术提出一种多媒体设备语音控制系统，包括：图像感应模块，采集用户动作图像；图像识别模块，根据用户动作图像确定控制指令类型或状态；语音识别状态管理模块，根据当前的控制指令类型激活或暂停语音识别；拾音模块，采集语音数据；语音识别模块，对采集到的语音数据进行识别，形成控制指令；多媒体功能模块，执行控制指令，向用户提供相应的多媒体功能。本发明专利技术还提出一种多媒体设备语音控制方法。本发明专利技术结合图像识别和语音识别技术，实现不依赖手持遥控器，不使用近距离拾音模块实现自由便捷的语音控制，有效避免了多媒体设备输出的声音、环境背景声音以及用户的非控制指令语音信号对控制指令语音识别的干扰，实现准确识别用户发出的控制指令。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音遥控技术，更具体地说，涉及。
技术介绍
继手机智能化后，电视、投影仪、游戏机等多种多媒体设备的智能化成为必然趋势。现有多种多媒体设备电视一般配备高性能控制芯片，具有开放式平台和操作系统；可由用户自行安装和卸载应用程序，此类应用程序扩展多媒体设备的功能；支持用户通过网络进行信息浏览和网络社交。以智能电视机为例，电视机不再局限于传统的电视节目播放功能，还通过运行应用程序实现音视频分享，交互娱乐游戏等多种功能。而传统的按键式遥控器已经无法满足多种多媒体功能选择和操作需求。现有技术提出包括触摸控制、声音控制、手势识别、体感控制等多种人机交互方案以实现智能控制，但由于电视机的使用场景限制和使用习惯问题，仍然没有一种智能控制方式能够完全取代手持遥控器，用户必须借助手持遥控器上的特定功能键和数字键组合来进行操控。例如触摸控制方案需要在借助遥控器上安装的触摸感应模块；手势识别方案其无法快捷地进行常用的节目频道跳转控制如用户想从当前的I频道切换到55频道，仅采用手势识别方式操作显然不如使用传统遥控器更加快捷；而体感控制方案的问题类似手势识别方案，通常还需要安装...

【技术保护点】
一种多媒体设备语音控制系统，其特征在于，包括：图像感应模块，采集用户动作图像；图像识别模块，根据用户动作图像确定控制指令类型或状态；语音识别状态管理模块，根据当前的控制指令类型激活或暂停语音识别；拾音模块，采集语音数据；语音识别模块，对采集到的语音数据进行识别，形成控制指令；多媒体功能模块，执行控制指令，向用户提供相应的多媒体功能。

【技术特征摘要】

【专利技术属性】
技术研发人员：王洪智，刘乐元，桑农，刘国华，
申请(专利权)人：深圳市国华识别科技开发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人