人机交互方法、装置、电子设备及存储介质制造方法及图纸

技术编号：42556056 阅读：27 留言：0更新日期：2024-08-29 00:27

本公开涉及计算机技术领域，尤其涉及人工智能、大语言模型、智能交互等技术领域，具体涉及一种人机交互方法、装置、电子设备及存储介质。具体实现方案：接收终端设备发送的对话文本；将对话文本输入大语言模型；其中，大语言模型用于基于对话文本依次生成多个回复文本片段；每得到大语言模型生成的第二预设数量个回复文本片段，则基于第二预设数量个回复文本片段，得到数字人回复内容，并将数字人回复内容发送给终端设备进行播报；或者，将第二预设数量个回复文本片段发送给数字人服务器。采用本公开能够提高数字人的响应效果，具体地，能够在降低响应延迟的基础上，确保整体回复内容的连贯性和流畅性。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其涉及人工智能、大语言模型、智能交互等，具体涉及一种人机交互方法、装置、电子设备及存储介质。

技术介绍

1、随着科技的进步和人工智能技术的发展，基于数字人实现的人机交互作为实现智能化服务的重要手段之一，正日益受到人们的关注。然而，实际应用中，在人机交互时，数字人的响应效果往往不尽如人意，比如，响应延迟较大，和/或整体回复内容的连贯性和流畅性较为一般。

技术实现思路

1、本公开提供了一种人机交互方法、装置、电子设备及存储介质。

2、根据本公开的一方面，提供了一种人机交互方法，应用于后端服务器，该方法包括：

3、接收终端设备发送的对话文本；其中，对话文本是通过对用户发出的语音信息进行转换得到的；

4、将对话文本输入大语言模型；其中，大语言模型用于基于对话文本依次生成多个回复文本片段，且多个回复文本片段中至少有第一预设数量个生成时间靠前的目标文本片段满足第一约束条件；第一约束条件包括与生成时间靠前的第一文本片段对应的语音播报时长大于或等于生...

【技术保护点】

1.一种人机交互方法，应用于后端服务器，所述方法包括：

2.根据权利要求1所述的方法，其中，所述多个回复文本片段还包括多个生成时间靠后的剩余文本片段；所述基于所述对话文本依次生成多个回复文本片段，包括：

3.根据权利要求2所述的方法，其中，所述基于所述对话文本依次生成多个剩余文本片段，包括：

4.根据权利要求2所述的方法，其中，所述基于所述对话文本依次生成多个剩余文本片段，包括：

5.根据权利要求4所述的方法，其中，所述得到第一数量阈值，包括：

6.根据权利要求1～5中任一项所述的方法，其中，第一预设数量个目标文本片段中生成时间...

【技术特征摘要】

1.一种人机交互方法，应用于后端服务器，所述方法包括：

3.根据权利要求2所述的方法，其中，所述基于所述对话文本依次生成多个剩余文本片段，包括：

4.根据权利要求2所述的方法，其中，所述基于所述对话文本依次生成多个剩余文本片段，包括：

5.根据权利要求4所述的方法，其中，所述得到第一数量阈值，包括：

6.根据权利要求1～5中任一项所述的方法，其中，第一预设数量个目标文本片段中生成时间最靠前的头部文本片段所包括的文本单元的数量小于或等于第二数量阈值。

7.根据权利要求1所述的方法，其中，所述基于所述第二预设数量个回复文本片段，得到数字人回复内容，包括：

8.根据权利要求7所述的方法，其中，所述得到与所述语音式回复片段对应的数字人画面，包括：

9.根据权利要求8所述的方法，其中，所述得到与所述多个语音片段一一对应的多个画面片段，包括：

10.根据权利要求7～9中任一项所述的方法，其中，所述对所述语音式回复片段和所述数字人画面进行合成，得到数字人回复内容，包括：

11.一种人机交互方法，应用于数字人服务器，所述方法包括：

12.根据权利要求11所述的方法，其中，所述基于所述第二预设数量个回复文本片段，得到数字人回复内容，包括：

13.根据权利要求12所述的方法，其中，所述得到与所述语音式回复片段对应的数字人画面，包括：

14.根据权利要求13所述的方法，其中，所述得到与所述多个语音片段一一对应的多个画面片段，包括：

15.根据权利要求12～14中任一项所述的方法，其中，所述对所述语音式回复片段和所述数字人画面进行合成...

【专利技术属性】
技术研发人员：常毅标，李秀睿，薄志浩，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人