当前位置: 首页 > 专利查询>涂悦专利>正文

一种基于视觉唤醒的语音控制方法技术

技术编号：12616258 阅读：98 留言：0更新日期：2015-12-30 13:41

本发明专利技术公开了一种基于视觉唤醒的语音控制方法，用于唤醒语音控制设备以使该语音控制设备对其接收的语音信号做出回复。本发明专利技术的语音控制方法包括语音控制设备接收到至少部分的语音信号后，启动安装在其上的图像接收单元；图像接收单元获取图像并传送到图像识别单元；图像识别单元识别图像，当在图像中检测到视线朝向该语音控制设备的人脸时，语音控制设备被唤醒以识别语音信号。本发明专利技术通过搜索视线朝向该语音控制设备的人脸的视觉唤醒功能来唤醒语音识别单元，更符合使用者的日常语音交互习惯，使用更为方便、智能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能控制
，尤其涉及。
技术介绍
随着科技的发展，从手控到音控，智能语音技术正逐步渗透至电视、家居、汽车、可穿戴设备等多个领域，越来越多的设备支持语音控制。未来的智能家庭很可能是完全或大部分地基于语音控制的。图1示出一个典型的语音控制设备的结构，其包含语音接收单元1，通常为麦克风，还包含语音识别单元2和处理单元3。语音识别单元2获取来自语音接收单元I的语音信号，并进行语音信号识别，将识别的结果发送给处理单元3，处理单元3指令该语音控制设备执行对应该语音信号的命令。在控制身边的多个诸如图1所示的语音控制设备时，与这些设备的语音交互中的一个重要功能是语音唤醒。这是可以理解的，为了区别地对待这多个语音控制设备，能将命令准确地发送给其中确定的一个设备而使其他设备不受影响，只唤醒这个设备使它接收命令是必要的前提。目前唤醒语音控制设备的语音唤醒一般基于唤醒词，例如设备的名称、代号等。但目前的这种语音唤醒方式具有很多先天缺陷，比如当用户说了和唤醒词相同/相近的词，那么虽然实际上用户并没有唤醒该设备的意思，设备也会被唤醒。另外，每次用户唤醒设备时都要说唤醒词，这对于用户来说并不是什么好的使用体验。由于人在语音交互中的一个普遍习惯是注视与其语音交互的对象，在用语音控制语音控制设备时，使用者也是习惯于注视着该设备。因此相比于目前的语音唤醒，通过检测使用者的目光确定唤醒的目标设备是更为符合使用者的日常体验的。因此，本领域的技术人员致力于开发，以更智能地唤醒目标设备。
技术实现思路
为实现上述目的，本专利技术提供了，用于唤醒语音控制设备以使所述语音控...

【技术保护点】
一种基于视觉唤醒的语音控制方法，用于唤醒语音控制设备以使所述语音控制设备对其接收的语音信号做出回复，其特征在于，所述语音控制方法包括：步骤一、语音控制设备接收到至少部分的所述语音信号后，启动安装在其上的图像接收单元；步骤二、所述图像接收单元获取图像并传送到图像识别单元；步骤三、所述图像识别单元识别所述图像，当在所述图像中检测到视线朝向所述语音控制设备的人脸时，所述语音控制设备被唤醒以识别所述语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员：涂悦，
申请(专利权)人：涂悦，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人