一种语音交互的方法及装置制造方法及图纸

技术编号:26045295 阅读:41 留言:0更新日期:2020-10-23 21:25
本申请的实施例提供一种语音交互的方法,包括:语音设备判断所述语音设备所在空间内的人数;当所述语音设备判断所述空间内的人数为一时,所述语音设备进入免唤醒语音交互方式。相较于现有技术,通过采用本发明专利技术提供的方案,在需要对智能设备操作时,可减少对智能设备的唤醒动作。

【技术实现步骤摘要】
【国外来华专利技术】一种语音交互的方法及装置
本申请实施例涉及通信
,尤其涉及一种语音提示的方法及装置。
技术介绍
人工智能技术在车载智能设备上广泛使用,但当前市场中的智能车载设备虽然搭载有语音操控功能,但均需在使用前进行语音唤醒(如“小驰你好”),且有识别不够灵敏、交互过于繁杂的普遍现象,已成为车载智能后视镜等产品用户最大的诟病之一。如果不使用唤醒词进行唤醒,又存在被频繁误唤醒的情况,特别是与其他人聊天时,设备误以为是对其下发的指令而进行响应,非常尴尬。目前有厂家提出采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间零间隔、零延迟、无缝对接,摒弃传统的一问一答的形式,减少用户语音操控的步骤及繁杂的唤醒动作。对于用户来说,使用智能设备每个功能的时候,不论先唤醒再问答还是唤醒问答一体化,因为都会有唤醒动作,所以会使车载设备和用户的交互过于复杂。
技术实现思路
本申请的实施例提供一种语音提示的方法及装置,在需要对智能设备操作时,可减少对智能设备的唤醒动作。一方面,本专利技术实施例提供了一种语音交互的方法,包括:语音设备判断所述语音设备所在空间内的人数;当所述语音设备判断所述空间内的人数为一时,所述语音设备进入免唤醒语音交互方式。在一个可能的设计中,所述语音设备判断所述语音设备所在空间内的人数,包括:所述语音设备根据声纹信息、虹膜信息、人像信息、指纹信息、感应数据中的一个或多个判断所述语音设备所在空间内的人数。语音设备通过多种方式识别语音设备所在空间内的人数,并综合判断,提高了识别语音设备所在空间内的人数的准确性。在一个可能的设计中,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:所述语音设备采集所述空间内的第一语音;所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;如果所述语音设备没有在所述第一时间段之内接收到所述第二语音,则确定所述空间内有一人。语音设备通过不同的声纹识别语音设备所在空间内的人数,是一种常用的识别方式,此例中判断空间中有一人。在一个可能的设计中,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:所述语音设备采集所述空间内的第一语音;如果所述第一语音不是所述特定指令,则所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;如果所述语音设备没有在所述第一时间段之内接收到所述第二语音,则确定所述空间内有一人。语音设备通过判断采集的第一语音不是特定指令,进一步判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,能更准确的确定该语音设备所在空间内的人数。本文中第一语音可以是首条语音。在一个可能的设计中,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:所述语音设备采集所述空间内的第一语音;如果所述第一语音不是所述特定的指令,则所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;如果所述语音设备在所述第一时间段之内接收到所述第二语音,则所述智能语音设备确定所述空间内有多人。语音设备通过判断采集的第一语音不是特定指令,进一步判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,能更准确的确定该语音设备所在空间内的人数。在一个可能的设计中,语音设备根据虹膜信息判断所述语音设备所在空间内的人数,包括:所述语音设备通过所述语音设备所在空间内的摄像头摄影得到虹膜识别的图像;所述语音设备判断所述图像中是否有不同的虹膜信息;当所述语音设备判断有不同的虹膜信息时,所述语音设备确定所述语音设备所在空间内有多人;当所述语音设备判断只有一种虹膜信息时,所述语音设备确定所述语音设备所在空间内为一人。此例中,语音设备根据虹膜信息判断所述语音设备所在空间内的人数,增加了一种确定所述语音设备所在空间内人数的方式。在一个可能的设计中,所述语音设备根据人像信息判断所述语音设备所在空间内的人数,包括:所述语音设备通过所述语音设备所在空间内的摄像头摄影得到人像信息;所述语音设备判断所述图像中是否有不同的人像信息;当所述语音设备判断有不同的人像信息时,所述语音设备确定所述语音设备所在空间内有多人;当所述语音设备判断只有一种人像信息时,所述语音设备确定所述语音设备所在空间内为一人。此例中,语音设备根据人像信息判断所述语音设备所在空间内的人数,增加了一种确定所述语音设备所在空间内人数的方式。在一个可能的设计中,语音设备根据指纹信息判断所述语音设备所在空间内的人数,包括:所述语音设备通过所述语音设备所在空间内的指纹识别装置获得得到指纹信息;所述语音设备判断所述图像中是否有不同的指纹信息;当所述语音设备判断有不同的指纹信息时,所述语音设备确定所述语音设备所在空间内有多人;当所述语音设备判断只有一种指纹信息时,所述语音设备确定所述语音设备所在空间内为一人。此例中,语音设备根据指纹信息判断所述语音设备所在空间内的人数,增加了一种确定所述语音设备所在空间内人数的方式。在一个可能的设计中,语音设备根据感应数据判断所述语音设备所在空间内的人数,包括:所述语音设备通过所述语音设备所在空间内的感应装置获得得到感应数据;所述语音设备判断所述图像中是否有不同的感应数据;当所述语音设备判断有不同的感应数据时,所述语音设备确定所述语音设备所在空间内有多人;当所述语音设备判断只有一种感应数据时,所述语音设备确定所述语音设备所在空间内为一人。此例中,语音设备根据感应数据判断所述语音设备所在空间内的人数,增加了一种确定所述语音设备所在空间内人数的方式。在一个可能的设计中,所述语音设备进入免唤醒语音交互方式之后,所述方法还包括:所述语音设备接收第三语音,所述第三语音不包括唤醒词;所述语音设备识别并执行所述第三语音对应的功能。此例中,语音设备进入免唤醒语音交互方式之后识别不包括唤醒词的第三语音,并执行相应的功能,能实现减少唤醒词的语音交互次数。在一个可能的设计中,当所述语音设备判断所述空间内有多人时,所述语音设备进入唤醒语音交互方式;所述语音设备接收唤醒词或者包括唤醒词的第四语音;所述语音设备进入语音交互方式或者语音识别并执行所述第四语音对应的功能。此例中,语音设备进入唤醒语音交互方式,可实现基于唤醒词的语音交互。在一个可能的设计中,所述语音设备所在的空间为封闭空间、半封闭空间或开放空间。在一个可能的设计中,半封闭空间或开放空间为以所述语音设备的通信距离为半径的球状空间。在一个可能的设计中,若所述封闭空间的半径小于或等于所述语音设备的通信距离,则所述语音设备所在的空间为所述封闭空间。另一方面,本专利技术实施例提供了一种语音设备,该语音设备具有实现上述方法实际中语音设备行为的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。再一方面,本专利技术实施例提供了一种计算本文档来自技高网...

【技术保护点】
一种语音交互的方法,其特征在于,包括:/n语音设备判断所述语音设备所在空间内的人数;/n当所述语音设备判断所述空间内的人数为一时,所述语音设备进入免唤醒语音交互方式。/n

【技术特征摘要】
【国外来华专利技术】一种语音交互的方法,其特征在于,包括:
语音设备判断所述语音设备所在空间内的人数;
当所述语音设备判断所述空间内的人数为一时,所述语音设备进入免唤醒语音交互方式。


根据权利要求1所述的方法,其特征在于,所述语音设备判断所述语音设备所在空间内的人数,包括:
所述语音设备根据声纹信息、虹膜信息、人像信息、指纹信息、感应数据中的一个或多个判断所述语音设备所在空间内的人数。


根据权利要求2所述的方法,其特征在于,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:
所述语音设备采集所述空间内的第一语音;
所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;
如果所述语音设备没有在所述第一时间段之内接收到所述第二语音,则确定所述空间内有一人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:
所述语音设备采集所述空间内的第一语音;
如果所述第一语音不是所述特定指令,则所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;
如果所述语音设备没有在所述第一时间段之内接收到所述第二语音,则确定所述空间内有一人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据声纹信息判断所述语音设备所在空间内的人数,包括:
所述语音设备采集所述空间内的第一语音;
如果所述第一语音不是所述特定的指令,则所述语音设备判断在接收到所述第一语音之后的第一时间段之内是否接收到第二语音,所述第二语音与所述第一语音具备不同的声纹特性;
如果所述语音设备在所述第一时间段之内接收到所述第二语音,则所述智能语音设备确定所述空间内有多人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据虹膜信息判断所述语音设备所在空间内的人数,包括:
所述语音设备通过所述语音设备所在空间内的摄像头摄影得到虹膜识别的图像;
所述语音设备判断所述图像中是否有不同的虹膜信息;
当所述语音设备判断有不同的虹膜信息时,所述语音设备确定所述语音设备所在空间内有多人;
当所述语音设备判断只有一种虹膜信息时,所述语音设备确定所述语音设备所在空间内为一人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据人像信息判断所述语音设备所在空间内的人数,包括:
所述语音设备通过所述语音设备所在空间内的摄像头摄影得到人像信息;
所述语音设备判断所述图像中是否有不同的人像信息;
当所述语音设备判断有不同的人像信息时,所述语音设备确定所述语音设备所在空间内有多人;
当所述语音设备判断只有一种人像信息时,所述语音设备确定所述语音设备所在空间内为一人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据指纹信息判断所述语音设备所在空间内的人数,包括:
所述语音设备通过所述语音设备所在空间内的指纹识别装置获得得到指纹信息;
所述语音设备判断所述图像中是否有不同的指纹信息;
当所述语音设备判断有不同的指纹信息时,所述语音设备确定所述语音设备所在空间内有多人;
当所述语音设备判断只有一种指纹信息时,所述语音设备确定所述语音设备所在空间内为一人。


根据权利要求2所述的方法,其特征在于,所述语音设备根据感应数据判断所述语音设备所在空间内的人数,包括:
所述语音设备通过所述语音设备所在空间内的感应装置获得得到感应数据;
所述语音设备判断所述图像中是否有不同的感应数据;
当所述语音设备判断有不同的感应数据时,所述语音设备确定所述语音设备所在空间内有多人;
当所述语音设备判断只有一种感应数据时,所述语音设备确定所述语音设备所在空间内为一人。


根据权利要求1-9任一项所述的方法,其特征在于,所述语音设备进入免唤醒语音交互方式之后,所述方法还包括:
所述语音设备接收第三语音,所述第三语音不包括唤醒词;
所述语音设备识别并执行所述第三语音对应的功能。


根据权利要求1-9任一项所述的方法,其特征在于,所述方法还包括:
当所述语音设备判断所述空间内有多人时,所述语音设备进入唤醒语音交互方式;
所述语音设备接收唤醒词或者包括唤醒词的第四语音;
所述语音设备进入语音交互方式或者语音识别并执行所述第四语音对应的功能。


根据权利要求1-11任一项所述的方法,其特征在于,所述语音设备所在的空间为封闭空间、半封闭空间或开放空间。


根据权利要求12所述的方法,其特征在于,半封闭空间或开放空间为以所述语音设备的通信距离为半径的球状空间。


根据权利要求12所述的方法,其特征在于,若所述封闭空间的半径...

【专利技术属性】
技术研发人员:魏建宾余尚春
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利