全双工语音控制方法、装置、存储介质及语音设备制造方法及图纸

技术编号:26847556 阅读:27 留言:0更新日期:2020-12-25 13:12
本公开涉及一种全双工语音控制方法、装置、存储介质及语音设备,解决了相关技术中全双工语音的交互过程中,容易受环境因素影响,导致误识别误执行的技术问题。该方法包括:在语音设备处于收音状态的情况下,响应于接收到目标对象发出的语音指令,采集目标对象的生物特征信息;在生物特征信息与预设特征信息相匹配的情况下,获取目标对象的发音方向信息;根据发音方向信息确定目标对象的发音方向是否朝向语音设备;在目标对象的发音方向朝向语音设备的情况下,执行语音指令对应的操作,并延长语音设备的收音时长;在目标对象的发音方向未朝向语音设备的情况下,丢弃语音指令对应的操作,并缩短语音设备的收音时长。

【技术实现步骤摘要】
全双工语音控制方法、装置、存储介质及语音设备
本公开涉及语音交互
,尤其涉及一种全双工语音控制方法、装置、存储介质及语音设备。
技术介绍
语音交互已经成为人们必不可少的人家交互方式,可实现一句话开灯、调电视台等,因此如何提高语音交互的体验,让语音交互更自然,已成为用户关注的话题,而全双工语音就是让语音交互更自然的一个方向。相关技术中,全双工语音的原理是始终打开mic收音,或者将收音时间延长在一定的收音时间段内,存在容易受环境因素影响,导致误识别误执行的问题。
技术实现思路
为克服相关技术中存在的技术问题,本公开提供一种全双工语音控制方法、装置、存储介质及语音设备。根据本公开实施例的第一方面,提供一种全双工语音控制方法,包括:在语音设备处于收音状态的情况下,响应于接收到目标对象发出的语音指令,采集所述目标对象的生物特征信息;在所述生物特征信息与预设特征信息相匹配的情况下,获取所述目标对象的发音方向信息;根据所述发音方向信息确定所述目标对象的发音方向是否朝向所述语音设备;...

【技术保护点】
1.一种全双工语音控制方法,其特征在于,所述方法包括:/n在语音设备处于收音状态的情况下,响应于接收到目标对象发出的语音指令,采集所述目标对象的生物特征信息;/n在所述生物特征信息与预设特征信息相匹配的情况下,获取所述目标对象的发音方向信息;/n根据所述发音方向信息确定所述目标对象的发音方向是否朝向所述语音设备;/n在所述目标对象的发音方向朝向所述语音设备的情况下,执行所述语音指令对应的操作,并延长所述语音设备的收音时长;/n在所述目标对象的发音方向未朝向所述语音设备的情况下,丢弃所述语音指令对应的操作,并缩短所述语音设备的收音时长。/n

【技术特征摘要】
1.一种全双工语音控制方法,其特征在于,所述方法包括:
在语音设备处于收音状态的情况下,响应于接收到目标对象发出的语音指令,采集所述目标对象的生物特征信息;
在所述生物特征信息与预设特征信息相匹配的情况下,获取所述目标对象的发音方向信息;
根据所述发音方向信息确定所述目标对象的发音方向是否朝向所述语音设备;
在所述目标对象的发音方向朝向所述语音设备的情况下,执行所述语音指令对应的操作,并延长所述语音设备的收音时长;
在所述目标对象的发音方向未朝向所述语音设备的情况下,丢弃所述语音指令对应的操作,并缩短所述语音设备的收音时长。


2.根据权利要求1所述的方法,其特征在于,所述采集所述目标对象的生物特征信息,包括:
根据所述语音指令采集所述目标对象的声纹信息。


3.根据权利要求1所述的方法,其特征在于,所述获取所述目标对象的发音方向信息,包括:
通过摄像头采集所述目标对象的影像信息,并根据所述影像信息确定所述目标对象的人脸特征信息以及口型特征信息;
根据所述影像信息确定所述目标对象的面部朝向,所述发音方向信息包括所述面部朝向。


4.根据权利要求1所述的方法,其特征在于,所述采集所述目标对象的生物特征信息,包括:
通过摄像头采集所述目标对象的影像信息,并根据所述影像信息确定所述目标对象的人脸特征信息以及口型特征信息;
采集所述目标对象的人脸特征信息以及口型特征信息。


5.根据权利要求4所述的方法,其特征在于,所述获取所述目标对象的发音方向信息,包括:
获取所述采集的所述目标对象的人脸特征信息以及口型特征信息;
根据所述影像信息确定所述目标对象的面部朝向,所述发音方向信息包括所述面部朝向。


6.根据权利要求1-5任一项所述的方法,其特征在于,
所述延长所述语音设备的收音时长,包括:根据预设的增长梯度延长所述收音时长,所述增长梯度包括多个增长比例,并且后一次的增长比例大于前一次的增长比例;
所述缩短所述语音设备的收音时长,包括:根据预设的缩短梯度缩短所述收音时长,所述缩短梯度包括多个缩短比例,并且后一次的缩短比例大于前一次的缩短比例。


7.根据权利要求1-5任一项所述的方法,其特征在于,在缩短所述语音设备的收音时长之后,所述方法还包括:
在缩短后的收音时长小于预设的最短收音时长阈值的情况下,控制所述语音设备停止收音。


8.一种全双工语音控制装置,其特征在于,所述装置包括:
第一信息获取模块,被配置成在语音设备处于收音状态的情况下,响应于接收到目标对象发出的语音指令,采集所述目标对象的生物特征信息;
第二信息获取模块,被配制成在所述生物特征信息与预设特征信息相匹配的情况下,获取所述目标对象的发音方向信息;
判断模块,被配置成根据所述发音方向信息确定所述目标对象的发音方向是否朝向所述语音设备;
第一执行模块,被配置成在所述目标对象的发音方向朝向所述语音设备的情况下,执...

【专利技术属性】
技术研发人员:陈士勇
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1