【技术实现步骤摘要】
语音交互方法、装置、设备及存储介质
[0001]本申请涉及智能识别
,尤其涉及一种语音交互方法
、
装置
、
设备及存储介质
。
技术介绍
[0002]在机器人工作的环境中,远处的说话声
、
近处的人与人的对话声
、
周边的电视机的播放声,甚至是环境中的嘈杂声,都会被机器人乱拾音,进而引发莫名其妙的错误对答
。
对近处的用户而言,似乎感觉机器人莫名其妙自言自语,甚至给人带来的不适感,感觉机器人看起来不可理喻和失去控制
。
[0003]可见,在机器人应用场景中,机器人往往会出现乱拾音乱搭话的现象
。
技术实现思路
[0004]鉴于上述问题,提出了本申请以提供一种解决上述问题或至少部分地解决上述问题的语音交互方法
、
装置
、
设备及存储介质
。
[0005]于是,在本申请的一个实施例中,提供了一种语音交互方法,包括:
[0006]当机器人采集到目标语音信息后,获取目标识别结果;所述目标识别结果是基于所述机器人在所述目标语音信息的语音结束时刻之前的目标时间段内采集到的视觉信息识别得到的;
[0007]根据所述目标识别结果,判断所述目标语音信息的目标受众是否为所述机器人;
[0008]判断出所述目标语音信息的目标受众为所述机器人时,控制所述机器人针对所述目标语音信息进行响应
。
[0009]在本申请的又一 ...
【技术保护点】
【技术特征摘要】
1.
一种语音交互方法,其特征在于,包括:当机器人采集到目标语音信息后,获取目标识别结果;所述目标识别结果是基于所述机器人在所述目标语音信息的语音结束时刻之前的目标时间段内采集到的视觉信息识别得到的;根据所述目标识别结果,判断所述目标语音信息的目标受众是否为所述机器人;判断出所述目标语音信息的目标受众为所述机器人时,控制所述机器人针对所述目标语音信息进行响应
。2.
根据权利要求1所述的方法,其特征在于,所述机器人上设有视觉信息采集装置;根据所述目标识别结果,判断所述目标语音信息的目标受众是否为所述机器人,包括:根据所述目标语音信息的拾音方向以及所述视觉信息采集装置的朝向,从所述目标识别结果中获取位于所述目标语音信息的拾音方向上的视觉识别结果;根据所述视觉识别结果,判断所述目标语音信息的目标受众是否为所述机器人
。3.
根据权利要求2所述的方法,其特征在于,所述视觉识别结果中包括位于所述目标语音信息的拾音方向上的人脸姿态;根据所述视觉识别结果,判断所述目标语音信息的目标受众是否为所述机器人,包括:根据所述目标语音信息的拾音方向以及所述视觉信息采集装置的朝向,确定有关人脸姿态的有效性标准;判断所述人脸姿态是否满足所述有效性姿态标准,以确定所述目标语音信息的目标受众是否为所述机器人
。4.
根据权利要求3所述的方法,其特征在于,所述视觉识别结果中还包括:位于所述目标语音信息的拾音方向上的人脸距离;根据所述视觉识别结果,判断所述目标语音信息的目标受众是否为所述机器人,还包括:判断所述人脸距离是否满足预设的有效性距离标准;若所述人脸距离满足所述预设的有效性距离标准,则触发所述根据所述目标语音信息的拾音方向以及所述视觉信息采集装置的朝向,确定有关人脸姿态的有效性标准的步骤
。5.
根据权利要求2至4中任一项所述的方法,其特征在于,还包括:根据所述目标语音信息的拾音方向以及所述视觉信息采集装置的朝向,确定所述拾音方向是否位于所述视觉信息采集装置的有效视觉区域内;若所述拾音方向未位于所述视觉信息采集装置的有效视觉区域内,则控制所述机器人转动所述视觉信息采集装置,以使所述拾音方向位于所述视觉信息采集装置的有效视觉区域内;获取基于后续视觉信息识别得到的后续视觉识别信息;所述后续视觉信息是所述机器人转动所述视觉信息采集...
【专利技术属性】
技术研发人员:李宁,韩科委,蒲东,周明才,欧杨,
申请(专利权)人:达闼机器人股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。