对话方法、装置、设备及存储介质制造方法及图纸

技术编号：37640453 阅读：16 留言：0更新日期：2023-05-25 10:07

本公开提供一种对话方法、装置、设备及存储介质，涉及人工智能技术领域，具体涉及人机交互、以及人机对话等技术领域，可应用于智能对话、智能客服、以及聊天机器人等场景下。具体实现方案包括：接收用户的会话信息；会话信息包括以下至少两种类型的会话内容：文本、语音、图片、以及视频；根据会话内容的类型和识别模型之间的对应关系，确定每种类型的会话内容对应的目标识别模型；利用目标识别模型分别识别对应类型的会话内容，得到每种类型的会话内容的识别结果；根据至少两种类型的会话内容的识别结果，确定目标话术；展示目标话术。本公开可以提高对用户的询问的识别精准度。以提高对用户的询问的识别精准度。以提高对用户的询问的识别精准度。

全部详细技术资料下载

【技术实现步骤摘要】
对话方法、装置、设备及存储介质

[0001]本公开涉及人工智能
，具体涉及人机交互、以及人机对话等
，可应用于智能对话、智能客服、以及聊天机器人等场景下，尤其涉及一种对话方法、装置、设备及存储介质。

技术介绍

[0002]随着计算机技术的不断发展，聊天机器人被广泛应用于各行各业。
[0003]目前聊天机器人可以获取用户的语音信息，并将该语音信息利用自动语音识别技术(automatic speech recognition，ASR)转换为文本，然后基于对文本的识别，理解用户的查询(query)，从而生成回复内容，并将回复内容通过从文本到语言(text to speech，TTS)技术将回复内容复述给用户。
[0004]但是，目前的聊天机器人可能无法充分理解用户的意图，无法精准回复用户的查询。

技术实现思路

[0005]本公开提供了一种对话方法、装置、设备及存储介质，能够对文本、语音、图片、以及视频等多模态的输入信息进行融合识别理解，充分理解用户意图，精准回复。
[0006]根据本公开的第一方面，提供了一种对话方法，该方法包括：接收用户的会话信息；会话信息包括以下至少两种类型的会话内容：文本、语音、图片、以及视频；根据会话内容的类型和识别模型之间的对应关系，确定每种类型的会话内容对应的目标识别模型；利用目标识别模型分别识别对应类型的会话内容，得到每种类型的会话内容的识别结果；根据至少两种类型的会话内容的识别结果，确定目标话术；展示目标话术。
[0007]根据本公...

【技术保护点】

【技术特征摘要】
1.一种对话方法，其特征在于，所述方法包括：接收用户的会话信息；所述会话信息包括以下至少两种类型的会话内容：文本、语音、图片、以及视频；根据会话内容的类型和识别模型之间的对应关系，确定每种类型的所述会话内容对应的目标识别模型；利用所述目标识别模型分别识别对应类型的所述会话内容，得到每种类型的所述会话内容的识别结果；根据所述至少两种类型的所述会话内容的识别结果，确定目标话术；展示所述目标话术。2.根据权利要求1所述的方法，其特征在于，所述根据所述至少两种类型的所述会话内容的识别结果，确定目标话术，包括：对所述至少两种类型的所述会话内容的识别结果中的字段进行融合，得到目标字段；根据预设字段和预设话术的对应关系，从所述预设话术中确定与所述目标字段匹配的目标话术。3.根据权利要求2所述的方法，其特征在于，所述对所述至少两种类型的所述会话内容的识别结果中的字段进行融合，得到目标字段，包括：获取每种类型的所述会话内容的识别结果中的字段；对所述至少两种类型的所述会话内容的识别结果中的字段取交集，得到所述目标字段。4.根据权利要求1所述的方法，其特征在于，所述根据所述至少两种类型的所述会话内容的识别结果，确定目标话术，包括：获取每种类型的所述会话内容的识别结果中的字段；根据预设字段和预设话术的对应关系，从所述预设话术中确定与所述至少两种类型的所述会话内容的识别结果中的每个字段分别匹配的待选话术；对所有的所述待选话术进行融合，得到所述目标话术。5.根据权利要求4所述的方法，其特征在于，所述对所有的所述待选话术进行融合，得到所述目标话术，包括：对所有的所述待选话术取交集，得到所述目标话术。6.根据权利要求1所述的方法，其特征在于，所述目标话术包括至少两个，所述展示所述目标话术包括：根据所述用户的历史会话记录中的上下文内容，从至少两个所述目标话术中确定与所述上下文内容相关的一个进行展示。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：向服务器发送所述会话信息的每种类型的所述会话内容的识别结果；接收所述服务器发送的推荐信息；所述推荐信息与所述会话内容的识别结果相关；展示会话评价界面；所述会话评价界面包括多个评价选项；响应于所述用户对所述多个评价选项中的任意一个评价选项的触发操作，展示预设信息和所述推荐信息。8.一种对话装置，其特征在于，所述装置包括：
获取模块，接收用户的会话信息；所述会话信息包括以下至少两种类型的会话内容：文本、语音、图片、以及视频；处理模块，用于根据会话内容的类型和识别模型之间的对应关系，确定每种类型...

【专利技术属性】
技术研发人员：李梦倩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人