语音唤醒方法和装置制造方法及图纸

技术编号:23559954 阅读:18 留言:0更新日期:2020-03-25 05:06
本发明专利技术公开语音唤醒方法和装置,其中,方法包括:对获取的音频数据进行VAD检测以判断是否有语音信号输入;响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断语音信号中是否包含预设唤醒词;若语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;基于人脸的连续数据判断用户是否具有对话意图;若判断用户具有对话意图,则执行唤醒。本申请实施例的方案通过在不能通过语音进行唤醒时,获取用户的人脸的连续数据,再根据该人脸的连续数据判断是否具有对话意图,如果有则可以唤醒设备,从而可以根据用户意图决定是否唤醒,而不只是依赖唤醒词,更加人性化,用户体验更好。

Voice wake up method and device

【技术实现步骤摘要】
语音唤醒方法和装置
本专利技术属于语音唤醒
,尤其涉及语音唤醒方法和装置。
技术介绍
相关技术中,目前大部分设备都能实现语音交互。语音交互也是智能设备必备的技能,可以使得人机交互更人性化,对话更智能。相关技术中,唤醒是语音交互过程中的一个重要环节。专利技术人在实现本申请的过程中发现,现有方案至少存在以下缺陷:目前大部分智能设备使用的语音交互,都需要根据设定好的唤醒词进行唤醒然后再对话,这使得交互较为麻烦和不友好。
技术实现思路
本专利技术实施例提供一种语音唤醒方法及装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种语音唤醒方法,包括:对获取的音频数据进行VAD检测以判断是否有语音信号输入;响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词;若所述语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;基于所述人脸的连续数据判断所述用户是否具有对话意图;若判断所述用户具有对话意图,则执行唤醒。第二方面,本专利技术实施例提供一种语音唤醒装置,包括:检测模块,配置为对获取的音频数据进行VAD检测以判断是否有语音信号输入;唤醒判断模块,配置为响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词;图像识别模块,配置为若所述语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;意图判断模块,配置为基于所述人脸的连续数据判断所述用户是否具有对话意图;以及唤醒执行模块,配置为若判断所述用户具有对话意图,则执行唤醒。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的语音唤醒方法的步骤。第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的语音唤醒方法的步骤。本申请的方法和装置提供的方案通过在不能通过语音进行唤醒时,获取用户的人脸的连续数据,再根据该人脸的连续数据判断是否具有对话意图,如果有则可以唤醒设备,从而可以根据用户意图决定是否唤醒,而不只是依赖唤醒词,更加人性化,用户体验更好。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种语音唤醒方法的流程图;图2为本专利技术一实施例提供的另一种语音唤醒方法的流程图;图3为本专利技术一实施例提供的又一种语音唤醒方法的流程图;图4为本专利技术一实施例提供的一种语音唤醒系统的一个具体实施例的流程示意图;图5为本专利技术一实施例提供的一种语音唤醒装置的框图;图6是本专利技术一实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其示出了本申请的语音唤醒方法一实施例的流程图,本实施例的语音唤醒方法可以适用于具备语音唤醒功能的智能语音设备,例如智能语音手机、智能音箱、智能语音机器人、智能语音玩具等,本申请在此没有限制。如图1所示,在步骤101中,对获取的音频数据进行VAD检测以判断是否有语音信号输入;在步骤102中,响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词;在步骤103中,若所述语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;在步骤104中,基于所述人脸的连续数据判断所述用户是否具有对话意图;在步骤105中,若判断所述用户具有对话意图,则执行唤醒。在本实施例中,对于步骤101,语音唤醒装置对获取用户的音频数据进行VAD检测来判断是否有用户的语音信号输入;然后,对于步骤102,如果VAD的检测结果为有语音信号输入,则对用户所输入的语音信号进行唤醒词检测用以判断用户的语音信号中是否包含预设的设备唤醒词;之后,对于步骤103,若设备检测到用户的语音信号中不包含预设唤醒词,设备就会开启图像识别来获取当前时刻用户的人脸的连续数据;然后,对于步骤104,设备基于所述人脸的连续数据判断所述用户是否具有对话意图;最后,对于步骤105,设备若判断所述用户具有对话意图,则执行实审的唤醒。例如,用户走到一台智能电视前进行讲话,然后智能电视就会获取用户的音频数据,再进行VAD检测用户的音频数据是否包含唤醒词,如果在不包含唤醒词的情况下,智能电视则会后台开启图像识别来确定用户是否有对话意图,例如,用户有没有注视着智能电视等处理结果,如果智能电视判定用户有对话意图则直接唤醒设备。本申请实施例的方案通过在不能通过语音进行唤醒时,获取用户的人脸的连续数据,再根据该人脸的连续数据判断是否具有对话意图,如果有则可以唤醒设备,从而可以根据用户的真实意图决定是否唤醒,而不只是依赖唤醒词来决定是否唤醒,对于用户忘记或者根本没有唤醒词的概念的场景更加友好,更加人性化,用户体验更好。进一步参考图2,其示出了本申请的语音唤醒方法另一实施例的流程图。其中,本实施例的流程图主要是针对流程图图1中步骤104“基于所述人脸的连续数据判断所述用户是否具有对话意图”之后的步骤进一步限定的步骤的流程图。如图2所示,在步骤201中,若判断所述用户不具有对话意图,基于所述语音信号和所述人脸的连续数据确定所述用户的画像;在步骤202中,基于所述画像确定针对所述用户的推荐信息;在步骤203中,将所述推荐信息反馈给所述用户。在本实施例中,对于步骤201,语音唤醒装置若判断所述用户不具有对话意图,基于所述语音信号和所述人脸的连续数据确定所述用户的画像,例如,在商场或者超市门口的智能机器人,收集用户的语音信号和人脸的连续数据来确定用户的画像,画像包括性别、年龄、兴趣爱好等信息;之后,对于步骤202,设备基于所述画像确定针对所述用户的推荐信息,例如,上述智能机器人基于收集用户的语音信息中“某某牌的衣服”和路人画像来生成推荐信息如“您好,某某品牌在二楼的扶梯口前方哦,祝您购物愉快”等推荐信息,或者例如“您好,请问有什么可以帮助您”的打招呼的推荐本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,包括:/n对获取的音频数据进行VAD检测以判断是否有语音信号输入;/n响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词;/n若所述语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;/n基于所述人脸的连续数据判断所述用户是否具有对话意图;/n若判断所述用户具有对话意图,则执行唤醒。/n

【技术特征摘要】
1.一种语音唤醒方法,包括:
对获取的音频数据进行VAD检测以判断是否有语音信号输入;
响应于VAD检测为有语音信号输入,对所输入的语音信号进行唤醒词检测以判断所述语音信号中是否包含预设唤醒词;
若所述语音信号中不包含预设唤醒词,开启图像识别获取当前时刻用户的人脸的连续数据;
基于所述人脸的连续数据判断所述用户是否具有对话意图;
若判断所述用户具有对话意图,则执行唤醒。


2.根据权利要求1所述的方法,其中,在基于所述人脸的连续数据判断所述用户是否具有对话意图之后,所述方法还包括:
若判断所述用户不具有对话意图,基于所述语音信号和所述人脸的连续数据确定所述用户的画像;
基于所述画像确定针对所述用户的推荐信息;
将所述推荐信息反馈给所述用户。


3.根据权利要求1所述的方法,其中,在对获取的音频数据进行VAD检测以判断是否有语音信号输入之后,所述方法还包括:
响应于VAD检测在某一预设时间内未检测到语音信号,开启图像识别获取当前时刻的图像的连续数据。


4.根据权利要求3所述的方法,其中,所述方法还包括:
基于所述图像的连续数据判断是否为动态图像数据,其中,所述动态图像数据中包含至少一个用户;
若判断为动态图像数据,基于所述动态图像数据确定所述至少一个用户的画像;
基于所述画像确定针对所述至少一个用户的推荐信息;
将所述推荐信息反馈给所述至少一个用户。


5.根据权利要求2或4所述的方法,其中,所述推荐信息包括打招呼、闲聊和提醒。...

【专利技术属性】
技术研发人员:孙尔伟
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1