语音唤醒方法和装置制造方法及图纸

技术编号：23559954 阅读：18 留言：0更新日期：2020-03-25 05:06

本发明专利技术公开语音唤醒方法和装置，其中，方法包括：对获取的音频数据进行VAD检测以判断是否有语音信号输入；响应于VAD检测为有语音信号输入，对所输入的语音信号进行唤醒词检测以判断语音信号中是否包含预设唤醒词；若语音信号中不包含预设唤醒词，开启图像识别获取当前时刻用户的人脸的连续数据；基于人脸的连续数据判断用户是否具有对话意图；若判断用户具有对话意图，则执行唤醒。本申请实施例的方案通过在不能通过语音进行唤醒时，获取用户的人脸的连续数据，再根据该人脸的连续数据判断是否具有对话意图，如果有则可以唤醒设备，从而可以根据用户意图决定是否唤醒，而不只是依赖唤醒词，更加人性化，用户体验更好。

Voice wake up method and device

全部详细技术资料下载

【技术实现步骤摘要】
语音唤醒方法和装置
本专利技术属于语音唤醒
，尤其涉及语音唤醒方法和装置。
技术介绍
相关技术中，目前大部分设备都能实现语音交互。语音交互也是智能设备必备的技能，可以使得人机交互更人性化，对话更智能。相关技术中，唤醒是语音交互过程中的一个重要环节。专利技术人在实现本申请的过程中发现，现有方案至少存在以下缺陷：目前大部分智能设备使用的语音交互，都需要根据设定好的唤醒词进行唤醒然后再对话，这使得交互较为麻烦和不友好。
技术实现思路
本专利技术实施例提供一种语音唤醒方法及装置，用于至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种语音唤醒方法，包括：对获取的音频数据进行VAD检测以判断是否有语音信号输入；响应于VAD检测为有语音信号输入，对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词；若所述语音信号中不包含预设唤醒词，开启图像识别获取当前时刻用户的人脸的连续数据；基于所述人脸的连续数据判断所述用户是否具有对话意图；若判断所述用户具有对话意图，则执行唤醒。第二方面，本专利技术实施例提供一种语音唤醒装置，包括：检测模块，配置为对获取的音频数据进行VAD检测以判断是否有语音信号输入；唤醒判断模块，配置为响应于VAD检测为有语音信号输入，对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词；图像识别模块，配置为若所述语音信号中不包含预设唤醒词，开启图像识别获取当前时刻用户的人脸的连续数据；意图判断模块，配置为基于所述人脸的...

【技术保护点】
1.一种语音唤醒方法，包括：/n对获取的音频数据进行VAD检测以判断是否有语音信号输入；/n响应于VAD检测为有语音信号输入，对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词；/n若所述语音信号中不包含预设唤醒词，开启图像识别获取当前时刻用户的人脸的连续数据；/n基于所述人脸的连续数据判断所述用户是否具有对话意图；/n若判断所述用户具有对话意图，则执行唤醒。/n

【技术特征摘要】
1.一种语音唤醒方法，包括：
对获取的音频数据进行VAD检测以判断是否有语音信号输入；
响应于VAD检测为有语音信号输入，对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词；
若所述语音信号中不包含预设唤醒词，开启图像识别获取当前时刻用户的人脸的连续数据；
基于所述人脸的连续数据判断所述用户是否具有对话意图；
若判断所述用户具有对话意图，则执行唤醒。

2.根据权利要求1所述的方法，其中，在基于所述人脸的连续数据判断所述用户是否具有对话意图之后，所述方法还包括：
若判断所述用户不具有对话意图，基于所述语音信号和所述人脸的连续数据确定所述用户的画像；
基于所述画像确定针对所述用户的推荐信息；
将所述推荐信息反馈给所述用户。

3.根据权利要求1所述的方法，其中，在对获取的音频数据进行VAD检测以判断是否有语音信号输入之后，所述方法还包括：
响应于VAD检测在某一预设时间内未检测到语音信号，开启图像识别获取当前时刻的图像的连续数据。

4.根据权利要求3所述的方法，其中，所述方法还包括：
基于所述图像的连续数据判断是否为动态图像数据，其中，所述动态图像数据中包含至少一个用户；
若判断为动态图像数据，基于所述动态图像数据确定所述至少一个用户的画像；
基于所述画像确定针对所述至少一个用户的推荐信息；
将所述推荐信息反馈给所述至少一个用户。

5.根据权利要求2或4所述的方法，其中，所述推荐信息包括打招呼、闲聊和提醒。...

【专利技术属性】
技术研发人员：孙尔伟，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人