人机交互方法、装置、设备及存储介质制造方法及图纸

技术编号：24995027 阅读：32 留言：0更新日期：2020-07-24 17:58

本申请公开了一种人机交互方法、装置、设备及存储介质，涉及智能语音识别技术领域。该方法包括：从目标用户的图像中获取目标用户的面部信息，该面部信息包括目标用户的面部朝向以及嘴唇状态；根据目标用户的面部信息，确定是否对目标用户进行响应。本申请实施例的技术方案，不需要在每轮对话的开始通过唤醒词进行唤醒，从而能够实现数字人与目标用户的高效自然的交流。

全部详细技术资料下载

【技术实现步骤摘要】
人机交互方法、装置、设备及存储介质
本申请涉及智能语音识别
，尤其涉及一种人机交互方法、装置、设备及存储介质。
技术介绍
随着人机交互技术的发展，智能语音设备例如智能音箱的应用越来越广泛，如何高效地进行人与机器的语音交互成为了关注的焦点。目前，智能语音设备均通过唤醒词唤醒进行交互，例如，通过预设唤醒词唤醒智能语音设备，再与智能语音设备进行语音交互。然而，在这种技术方案中，在多轮的语音交互过程中，每轮语音交互都需说唤醒词，因此，通过唤醒词唤醒的方式交互流程比较繁琐，不能达到像人与人之间的自然交互。因此，如何高效自然地与智能语音设备进行语音交互成为了亟待解决的技术难题。
技术实现思路
本申请实施例提供一种人机交互方法、装置、设备及存储介质，用于解决如何高效自然地与智能语音设备进行语音交互的问题。第一方面，本申请提供一种人机交互方法，包括：从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；根据所述目标用户的面部信息，确...

【技术保护点】
1.一种人机交互方法，其特征在于，包括：/n从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；/n根据所述目标用户的面部信息，确定是否对所述目标用户进行响应。/n

【技术特征摘要】
1.一种人机交互方法，其特征在于，包括：
从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；
根据所述目标用户的面部信息，确定是否对所述目标用户进行响应。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标用户的面部信息，确定是否对所述目标用户进行响应，包括：
根据所述目标用户的面部信息，确定所述目标用户的所述面部朝向以及所述嘴唇状态；
若所述面部朝向的方向为预定方向，并且所述嘴唇状态为唇动状态，则确定对所述目标用户进行响应。

3.根据权利要求2所述的方法，其特征在于，所述预定方向为虚拟对象的正面方向，所述对所述目标用户进行响应，包括：
通过所述虚拟对象对所述目标用户进行响应。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
从所述目标用户的图像中获取所述目标用户的当前状态，所述当前状态包括：所述目标用户的动作、表情、环境中的一种或多种；
根据所述当前状态，对所述目标用户进行响应。

5.根据权利要求4所述的方法，其特征在于，所述根据所述当前状态，对所述目标用户进行响应，包括：
根据所述目标用户的当前状态，确定对所述目标用户的反馈优先级；
基于所述反馈优先级，对所述目标用户进行响应。

6.根据权利要求4所述的方法，其特征在于，所述对所述目标用户进行响应，包括：
获取所述目标用户的语音信息；
根据所述当前状态和所述语音信息，通过虚拟对象对所述目标用户进行反馈操作，所述反馈操作包括语音反馈、动作反馈以及表情反馈中的一种或多种。

7.根据权利要求4所述的方法，其特征在于，所述对所述目标用户进行响应，包括：
获取所述目标用户的语音信息；
根据所述当前状态以及所述语音信息，调用第三方应用程序对所述目标用户进行响应。

8.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：
若确定对所述目标用户进行响应，则获取所述目标用户发出的语音信息；
基于所述语音信息，对所述目标用户进行语音反馈。

9.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：
接收所述目标用户通过图形用户界面输入的交互指令，根据所述交互指令对所述目标用户进行反馈。

10.一种人机交互装置，其特征在于，包括：
信息获取模块，用于从目标用户的图像中获取所述目标用户的面部信息，所述面部信息包括所述目标用户的面部朝向以及嘴唇状态；
响应判断模块，用于根据所述目标用户的面部信息，确定是否对所述目标用户进行响应。

【专利技术属性】
技术研发人员：李扬，李士岩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人