人机交互方法、语音处理方法及设备技术

技术编号：24760280 阅读：73 留言：0更新日期：2020-07-04 10:07

本申请实施例提供一种人机交互方法、语音处理方法及设备。其中，方法包括如下的步骤：采集用户发出的语音信息；确定所述用户在发出所述语音信息时的脸部朝向信息；根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应。本申请实施例提供的技术方案中，不仅能够降低误识别率，还能避免现有技术中因每轮会话时需唤醒设备导致的用户与设备交流的效率低下以及自然度较差等问题。

Human computer interaction method, speech processing method and equipment

全部详细技术资料下载

【技术实现步骤摘要】
人机交互方法、语音处理方法及设备
本申请涉及电子
，尤其涉及一种人机交互方法、语音处理方法及设备。
技术介绍
随着语音识别技术和自然语音处理技术的发展，与电子设备进行语音对话等方式可有效减少用户交互成本，方便用户使用。目前，市面上的智能音箱、智能手机中的语音助手都可以实现与用户进行语音对话功能。现有技术中，为了降低误识别率，在与用户完成一轮会话后，智能音箱就会进行休眠处理，即智能音箱进入休眠状态；若用户还想继续与智能音箱进行会话，用户还需要通过唤醒词唤醒智能音箱。也就是说，用户与智能音箱的每轮会话都需要喊一下唤醒词，影响用户与设备交流的效率和自然。
技术实现思路
鉴于上述问题，提出了本申请以提供一种解决上述问题或至少部分地解决上述问题的人机交互方法、语音处理方法及设备。于是，在本申请的一个实施例中，提供了一种人机交互方法。该方法包括：采集用户发出的语音信息；获取所述用户在发出所述语音信息时的脸部朝向信息；基于所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应。...

【技术保护点】
1.一种人机交互方法，其特征在于，包括：/n采集用户发出的语音信息；/n确定所述用户在发出所述语音信息时的脸部朝向信息；/n根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应。/n

【技术特征摘要】
1.一种人机交互方法，其特征在于，包括：
采集用户发出的语音信息；
确定所述用户在发出所述语音信息时的脸部朝向信息；
根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应。

2.根据权利要求1所述的方法，其特征在于，所述脸部朝向信息包括：面部朝向；
根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应，包括：
所述面部朝向为第一方向时，确定需要对所述语音信息作出相应的响应。

3.根据权利要求2所述的方法，其特征在于，所述脸部朝向信息还包括：视觉朝向；
所述面部朝向为第一方向时，确定需要对所述语音信息作出相应的响应，包括：
所述面部朝向和所述视觉朝向均为第一方向时，确定需要对所述语音信息作出相应的响应。

4.根据权利要求1至3中任一项所述的方法，其特征在于，确定所述用户在发出所述语音信息时的脸部朝向信息，包括：
获取在所述用户发出所述语音信息时采集的图像信息；
对所述图像信息进行图像识别，以得到所述脸部朝向信息。

5.根据权利要求1至3中任一项所述的方法，其特征在于，还包括：
在所述用户发出所述语音信息时，检测所述用户是否在第一预设范围内；
根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应，包括：
所述用户在所述第一预设范围内时，根据所述脸部朝向信息，确定是否需要对所述语音信息作出相应的响应。

6.一种语音处理方法，其特征在于，包括：
采集用户发出的语音信息；
确定所述用户在发出所述语音信息时的脸部朝向信息；
基于所述脸部朝向信息，确定所述语音信息是否为所述用户的语音指令。

7.根据权利要求6所述的方法，其特征在于，所述脸部朝向信息包括：面部朝向；
基于所述脸部朝向信息，确定所述语音信息是否为所述用户的语音指令，包括：
所述面部朝向为第一方向时，确定所述语音信息为所述用户的语音指令。

8.根据权利要求7所述的方法，其特征在于，所述脸部朝向信息还包括：视觉朝向；
所述面部朝向为第一方向时，确定所述语音信息是否为所述用户的语音指令，包括：
所述面部朝向和所述视觉朝向均为第一方向时，确定所述语音信息为所述用户的语音指令。

9.根据权利要求6至8任一项所述的方法，其特征在于，还包括：
在所述用户发出所述语音信息时，检测所述用户是否在第一预设范围内；
根据所述脸部朝向信息，确定所述语音信息是否为所述用户的语音指令，包括：
所述用户在所述第一预设范围内时，根据所述脸部朝向信息，确定所述语音信息是否为所述用户的语音指令。

10.一种人机交互方法，其特征在于，包括：
在完成一轮会话后，保持唤醒状态以等待采集用户再次发出的语音信息；
采集到所述用户再次发出的语音信息时，获取在所述用户发出所述语音信息时采集的图像信息；
基于所述图像信息，确定是否需要对所述语音信息作出相应的响应。

11.根据权利要求10所述的方法，其特征在于，基于所述图像信息，确定是否需要对所述语音信息作出相应的响应，包括：
对所述图像信息进行图像识别，以得到所述用户在发出所述语音信息时的脸部朝向信息；<...

【专利技术属性】
技术研发人员：方婷，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人