语音识别处理方法及电子设备技术

技术编号：40182475 阅读：4 留言：0更新日期：2024-01-26 23:48

本申请提供了一种语音识别处理方法及电子设备，包括：确定第一用户第一语音的第一语音内容信息；通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理，得到第一意图识别结果；基于第一意图识别结果若得到用户明确意图，执行得到的用户明确意图。若无法得到用户明确意图，生成意图确认信息，向第一用户呈现意图确认信息，确定用户响应情况信息，以进行对应处理。如此，基于用户意图识别模型可以方便、准确地进行用户意图识别处理以确定用户明确意图，以及即使基于用户意图识别模型无法得到用户明确意图，通过意图确认信息和响应情况信息与用户进行人机交互可以进一步明确用户意图，可以更好提供人机语音交互服务，有效提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人机语音交互，特别涉及一种语音识别处理方法及电子设备。

技术介绍

1、随着科学技术的发展，越来越来的电子设备可以支持人机语音交互。并且电子设备基于用户语音可以识别出用户意图，并作出对应响应。当前，电子设备中提前设置有电子设备所支持的语音交互功能对应的功能指令，电子设备通过将接收到的用户语音指令与提前设置好的功能指令进行匹配的方式，来识别用户意图。

2、具体的，以汽车行业为例，随着新能源汽车的高速发展，汽车被加入了智能导航系统、智能娱乐系统等，并且随着车联网的发展，通过例如手机等移动终端来远程控制、查看和处理汽车相关的信息也变得越来越普及。现有技术中，在例如通过手机中的语音助手app对车辆进行远程控制的场景中，手机中的语音助手app中提前设置有车辆控制指令(即功能指令)，用户需要对车辆进行控制时，通过语音助手app输入用户语音指令，手机将用户语音指令与语音助手app中提前设置好的车辆控制指令进行匹配，如果存在与用户语音指令一致的车辆控制指令，则认为识别出用户意图，将该车辆控制指令下发至车辆，以使车辆执行车辆控制指令。这种方式中，语音助手app中必须提前设置好车辆控制指令，并且用户输入的用户语音指令必须与提前设置好的车辆控制指令一致，手机才能识别出用户意图进行对应远程控制。因此，用户需要清楚记住提前设定好的车辆控制指令才能完成远程控制，用户一旦忘记或者说错车辆控制指令，手机将无法确定用户意图，并无法控制车辆做出对应响应，影响用户体验。

3、因此，现有技术中，电子设备通过将接收到的用户语音指令与提前设

技术实现思路

1、本申请实现方式提供了一种语音识别处理方法及电子设备，以解决现有技术中存在的用户需要清楚记住预先设定好的功能指令才能完成语音交互，用户一旦忘记或者说错功能指令，电子设备将无法确定用户意图，并无法进行对应处理，影响用户体验，即当前电子设备存在无法向用户提供更好地人机语音交互服务的问题。

2、为解决上述技术问题，第一方面，本申请实现方式提供了一种语音识别处理方法，该方法包括：确定第一用户的第一语音，并确定第一语音对应的第一语音内容信息；通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理，得到第一意图识别结果；基于第一意图识别结果若得到用户明确意图，则执行得到的用户明确意图；基于第一意图识别结果若无法得到用户明确意图，则生成意图确认信息，向第一用户呈现意图确认信息，以继续与第一用户的会话，并确定用户针对意图确认信息的响应情况信息，根据响应情况信息进行对应处理。

3、本申请实现方式中，在接收到用户的第一语音后，确定第一语音对应的第一语音内容信息，通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理，得到第一意图识别结果。如此，基于用户意图识别模型就可以方便、准确地进行用户意图识别处理，以确定用户意图，相比于现有技术中需要提前设置功能指令进行匹配的方式，用户意图的识别更为准确、全面，因此可以更好地提供人机语音交互服务，有效地提升了用户体验。进一步地，基于第一意图识别结果若得到用户明确意图，则直接执行得到的用户明确意图，即作出对应响应，以实现与用户的语音交互。基于第一意图识别结果若无法得到用户明确意图，则生成意图确认信息，向第一用户呈现意图确认信息，以继续与第一用户的会话，并确定用户针对意图确认信息的响应情况信息，根据响应情况信息进行对应处理。如此，即使基于用户意图识别模型无法得到用户明确意图，仍然能够通过意图确认信息和响应情况信息以进一步与用户进行人机交互以进一步明确用户意图，并进行相应处理，可以更好地提供人机语音交互服务，有效地提升了用户体验。

4、根据本申请的另一种具体实现方式，本申请的实现方式公开的一种语音识别处理方法，通过用户意图识别模型针对第一语音内容信息进行用户意图识别处理，得到第一意图识别结果，包括：将第一语音内容信息输入至用户意图识别模型，由用户意图识别模型进行用户意图识别处理，得到第一意图识别结果；或者将第一语音内容信息，以及第一语音内容信息的关联信息输入至用户意图识别模型，由用户意图识别模型进行用户意图识别处理，得到第一意图识别结果。

5、根据本申请的另一种具体实现方式，本申请的实现方式公开的一种语音识别处理方法，第一语音内容信息的关联信息包括以下信息中的至少一项：第一语音所属会话中第一语音之前的历史会话信息；第一用户的用户历史会话信息；第一用户的用户特征信息；第一用户的历史行为信息。

6、采用上述方案，基于用户意图识别模型进行用户意图识别处理，并且基于语音内容信息以及语音内容信息的关联信息进行用户意图识别处理，能够得到更为准确的意图识别结果，提升意图识别的准确度，使得即使用户语音不明确时，仍然能够基于语音内容信息的关联信息识别出明确的意图。

7、根据本申请的另一种具体实现方式，本申请的实现方式公开的一种语音识别处理方法，基于第一意图识别结果若无法得到用户明确意图，则生成意图确认信息，包括：若用户意图识别模型识别出至少两个用户意图，确定基于第一意图识别结果无法得到用户明确意图，根据至少两个用户意图生成意图确认信息，或者根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息；若用户意图识别模型无法识别出用户意图，确定基于第一意图识别结果无法得到用户明确意图，根据第一语音内容信息生成意图确认信息，或者根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息。

8、采用上述方案，若用户意图识别模型识别出两个以上的用户意图，根据至少两个用户意图以及第一语音内容信息和/或第一语音内容信息的关联信息生成意图确认信息，如此，能够生成更为准确的意图确认信息，并基于与用户的进一步交互确定用户真正意图。若未识别出用户意图，则根据第一语音内容信息和第一语音内容信息的关联信息生成意图确认信息，使得即使用户语音不明确，仍然能够生成更为准确的意图确认信息，并基于与用户的进一步交互确定用户真正意图，提升用户的语音交互体验。

9、根据本申请的另一种具体实现方式，本申请的实现方式公开的一种语音识别处理方法，根据响应情况信息进行对应处理，包括：在根据响应情况信息确定第一用户针对意图确认信息未作出响应的情况下，结束用户意图识别处理，或者生成第一信息，并向第一用户呈现第一信息，以继续与第一用户的会话；在根据响应情况信息确定第一用户针对意图确认信息作出响应的情况下，通过用户意图识别模型针对响应情况信息进行用户意图识别处理，得到第二意图识别结果，根据第二意图识别结果进行对应处理。

10、采用本文档来自技高网...

【技术保护点】

1.一种语音识别处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语音识别处理方法，其特征在于，通过用户意图识别模型针对所述第一语音内容信息进行用户意图识别处理，得到第一意图识别结果，包括：

3.根据权利要求2所述的语音识别处理方法，其特征在于，所述第一语音内容信息的关联信息包括以下信息中的至少一项：

4.根据权利要求1-3任意一项所述的语音识别处理方法，其特征在于，基于所述第一意图识别结果若无法得到用户明确意图，则生成意图确认信息，包括：

5.根据权利要求1-4任意一项所述的语音识别处理方法，其特征在于，根据所述响应情况信息进行对应处理，包括：

6.根据权利要求5所述的语音识别处理方法，其特征在于，根据所述第二意图识别结果进行对应处理，包括：

7.根据权利要求6所述的语音识别处理方法，其特征在于，在基于所述第二意图识别结果无法得到用户明确意图，结束用户意图识别处理的情况下，所述方法还包括：

8.根据权利要求1-7任意一项所述的语音识别处理方法，其特征在于，执行得到的用户明确意图，包括：

9.根据权利要求8所述的语音识别处理方法，其特征在于，根据所述意图类型，执行得到的用户明确意图，包括：

10.根据权利要求1-9任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

11.根据权利要求1-10任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

12.根据权利要求1-11任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

13.根据权利要求1-12任意一项所述的语音识别处理方法，其特征在于，所述用户意图识别模型通过以下信息进行模型训练得到：

14.根据权利要求1-13任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

15.一种语音识别处理方法，其特征在于，应用于语音识别处理系统，所述语音识别处理系统包括移动终端、云端和车端，所述方法包括：

16.根据权利要求15所述的语音识别处理方法，其特征在于，所述云端通过用户意图识别模型针对所述第一语音内容信息进行用户意图识别处理，得到第一意图识别结果，包括：

17.根据权利要求15或16所述的语音识别处理方法，其特征在于，所述云端基于所述第一意图识别结果若无法得到用户明确意图，则生成意图确认信息，包括：

18.根据权利要求15-17任意一项所述的语音识别处理方法，其特征在于，所述云端根据所述响应情况信息进行对应处理，包括：

19.根据权利要求18所述的语音识别处理方法，其特征在于，所述云端根据所述第二意图识别结果进行对应处理，包括：

20.根据权利要求19所述的语音识别处理方法，其特征在于，所述云端在基于所述第二意图识别结果无法得到用户明确意图，结束用户意图识别处理情况下，所述方法还包括：

21.根据权利要求15-20任意一项所述的语音识别处理方法，其特征在于，所述云端通过所述移动终端和/或所述车端执行得到的用户明确意图，包括：

22.根据权利要求21所述的语音识别处理方法，其特征在于，所述云端根据所述意图类型，通过所述移动终端和/或所述车端执行得到的用户明确意图，包括：

23.根据权利要求21所述的语音识别处理方法，其特征在于，所述云端根据所述意图类型，通过所述移动终端和/或所述车端执行得到的用户明确意图，包括：

24.根据权利要求23所述的语音识别处理方法，其特征在于，所述方法还包括：

25.根据权利要求22或24所述的语音识别处理方法，其特征在于，所述云端在确定所述用户明确意图的所述意图类型为设置意图的情况下，所述方法还包括：

26.根据权利要求21所述的语音识别处理方法，其特征在于，所述云端根据所述意图类型，通过所述移动终端和/或所述车端执行得到的用户明确意图，包括：

27.根据权利要求21所述的语音识别处理方法，其特征在于，所述云端根据所述意图类型，通过所述移动终端和/或所述车端执行得到的用户明确意图，包括：

28.根据权利要求15-27任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

29.根据权利要求15-28任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

30.根据权利要求15-29任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

31.根据权利要求15-30任意一项所述的语音识别处理方法，其特征在于，所述方法还包括：

...

【技术特征摘要】