对话处理方法技术

技术编号:39720083 阅读:6 留言:0更新日期:2023-12-17 23:26
本申请提供一种对话处理方法

【技术实现步骤摘要】
对话处理方法、对话模型训练方法、装置、设备及介质


[0001]本申请涉及地图
,尤其涉及一种对话处理方法

对话模型训练方法

装置

设备及介质


技术介绍

[0002]集成了对话功能的地图应用,可以采用人机对话的方式与用户进行地图领域的对话

通过该功能,可以帮助用户更加便捷的使用地图应用,也给用户带来更加亲切

自然的交互体验

然而,目前,地图应用存在对话不够智能,对话场景单一,仅能与用户进行地图领域的对话,而无法满足用户其他对话需求的问题


技术实现思路

[0003]本申请提供一种对话处理方法

对话模型训练方法

装置

设备及介质,可以提高地图应用对话回复的智能性,扩大对话场景,使得地图应用除满足用户面向地图领域的对话需求外,还可以满足用户面向开放领域的对话需求

[0004]第一方面,本申请提供一种对话处理方法,所述方法包括:
[0005]获取用户输入的对话文本;
[0006]利用对话模型,获取所述对话文本在目标领域下的对话回复;其中,所述对话模型为采用训练数据集对使用通用语料训练的大规模语言模型进行微调得到的,所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

>基于地图领域的历史兴趣点搜索与导航路径规划数据构建的第三训练数据子集,以及,基于地图领域的历史对话数据构建的第四训练数据子集;所述目标领域包括开放领域或地图领域;所述地图领域为与地图应用提供的服务相关的领域;
[0007]输出所述对话回复

[0008]第二方面,本申请提供一种对话模型训练方法,所述方法包括:
[0009]获取训练数据集;所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

基于地图领域的历史兴趣点搜索与导航路径规划数据构建的第三训练数据子集,以及,基于地图领域的历史对话数据构建的第四训练数据子集;
[0010]使用所述训练数据集对使用通用语料训练的大规模语言模型进行微调,得到对话模型;所述对话模型用于处理地图领域的对话,以及,开放领域的对话;所述地图领域为与地图应用提供的服务相关的领域

[0011]第三方面,本申请提供一种对话处理装置,所述装置包括:
[0012]第一获取模块,用于获取用户输入的对话文本;
[0013]第二获取模块,用于利用对话模型,获取所述对话文本在目标领域下的对话回复;其中,所述对话模型为采用训练数据集对使用通用语料训练的大规模语言模型进行微调得
到的,所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

基于地图领域的历史兴趣点搜索与导航路径规划数据构建的第三训练数据子集,以及,基于地图领域的历史对话数据构建的第四训练数据子集;所述目标领域包括开放领域或地图领域;所述地图领域为与地图应用提供的服务相关的领域;
[0014]输出模块,用于输出所述对话回复

[0015]第四方面,本申请提供一种对话模型训练装置,所述装置包括:
[0016]获取模块,用于获取训练数据集;所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

基于地图领域的历史兴趣点搜索与导航路径规划数据构建的第三训练数据子集,以及,基于地图领域的历史对话数据构建的第四训练数据子集;
[0017]微调模块,用于使用所述训练数据集对使用通用语料训练的大规模语言模型进行微调,得到对话模型;所述对话模型用于处理地图领域的对话,以及,开放领域的对话;所述地图领域为与地图应用提供的服务相关的领域

[0018]第五方面,本申请提供一种电子设备,包括:处理器和存储器;所述处理器与所述存储器通信连接;
[0019]所述存储器存储计算机指令;
[0020]所述处理器执行所述存储器存储的计算机指令,以实现如第一方面任一项所述的方法,或,第二方面中任一项所述的方法

[0021]第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面任一项所述的方法,或,第二方面中任一项所述的方法

[0022]第七方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面任一项所述的方法,或,第二方面任一项所述的方法

[0023]本申请提供的对话处理方法

对话模型训练方法

装置

设备及介质,通过使用地图领域的语料扩充大规模语言模型的词表,以及,使用地图领域相关的训练数据对扩充词表后的利用通用语料训练的大规模语言模型进行微调,可以使大规模语言模型学习到地图领域的相关知识,得到“既能处理地图领域的对话又能处理开放领域的对话”的对话模型

[0024]当将上述对话模型应用于地图应用的对话系统中时,可以对用户的对话意图进行准确的识别

在用户具有地图领域的对话需求时,利用该对话模型提供地图领域的对话回复,在用户具有开放领域的对话需求时,还可以为用户提供开放领域的用户对话理解

任务处理,以及,回复生成服务,扩大了对话系统的应用场景,进而可以更好的满足用户的使用需求,进一步提升用户的使用体验,为用户提供更加智能化的对话服务

相比于现有技术仅能与用户进行地图领域的对话的这种单一场景,本申请还可以满足用户面向开放领域的对话需求,扩大了地图应用的对话场景

附图说明
[0025]为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本申请的一
些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图

[0026]图1为本申请实施例提供的第一种对话处理方法的流程示意图;
[0027]图2为本申请实施例提供的一种利用对话模型进行对话处理的逻辑示意图;
[0028]图3为本申请实施例提供的第二种对话处理方法的流程示意图;
[0029]图4为本申请实施例提供的第三种对话处理方法的流程示意图;
[0030]图5为本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种对话处理方法,其特征在于,所述方法包括:获取用户输入的对话文本;利用对话模型,获取所述对话文本在目标领域下的对话回复;其中,所述对话模型为采用训练数据集对使用通用语料训练的大规模语言模型进行微调得到的,所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

基于地图领域的历史兴趣点搜索与导航路径规划数据构建的第三训练数据子集,以及,基于地图领域的历史对话数据构建的第四训练数据子集;所述目标领域包括开放领域或地图领域;所述地图领域为与地图应用提供的服务相关的领域;输出所述对话回复
。2.
根据权利要求1所述的方法,其特征在于,所述获取所述对话文本在所述目标领域下的对话回复,包括:根据所述对话文本以及领域意图理解提示模板,生成领域意图理解提示;将所述领域意图理解提示输入至所述对话模型,以对所述对话文本进行领域意图理解,得到所述对话文本所属的目标领域;利用所述对话模型,获取所述对话文本在所述目标领域下的对话回复
。3.
根据权利要求2所述的方法,其特征在于,所述目标领域为地图领域,所述利用对话模型,获取所述对话文本在所述目标领域下的对话回复,包括:根据所述对话文本以及子领域意图理解提示模板,生成子领域意图理解提示;将所述子领域意图理解提示输入至所述对话模型,以对所述对话文本进行领域意图理解,得到所述对话文本所属的地图领域的目标子领域;根据所述对话文本,获取所述对话文本的词槽;根据所述目标子领域,以及,所述词槽,获取对话回复内容;根据所述对话回复内容

所述对话文本,以及,对话回复提示模板,生成对话回复提示;将所述对话回复提示输入至所述对话模型,获取所述对话回复
。4.
根据权利要求2所述的方法,其特征在于,所述目标领域为开放领域,所述利用对话模型,获取所述对话文本在所述目标领域下的对话回复,包括:根据所述对话文本,以及,任务构建提示模板,生成任务构建提示;将所述任务构建提示输入至所述对话模型,以获取所述对话文本对应的任务;获取所述任务的对话回复内容关键词;根据所述对话回复内容关键词

所述对话文本,以及,对话回复提示模板,生成对话回复提示;将对话回复提示输入至所述对话模型,获取所述对话回复
。5.
根据权利要求4所述的方法,其特征在于,所述获取所述任务的对话回复内容关键词,包括:若所述对话文本对应的任务为多个,则根据所述任务,以及,任务优先级排序提示模板,生成任务优先级排序提示;将所述任务优先级排序提示输入至所述对话模型,获取对所述任务按照优先级排序后生成的任务队列;依次获取所述任务队列中任务的对话回复内容关键词

6.
根据权利要求5所述的方法,其特征在于,所述获取所述任务队列中任务的对话回复内容关键词,包括:根据所述任务,以及,任务处理提示模板,生成任务处理提示;将所述任务处理提示输入至所述对话模型,以获取所述任务的处理结果;根据所述任务的处理结果,获取所述任务的对话回复内容;根据所述任务

所述任务的对话回复内容,以及,关键词提取模板,获取关键词提取提示;将所述关键词提取提示输入至所述对话模型,以获取针对所述任务的对话回复内容关键词;根据所述对话回复内容关键词,以及,任务状态提示模板,生成所述任务状态提示;所述任务状态提示用于指示所述对话模型确定所述任务的执行状态,以及,在所述任务处于未执行完毕的状态时,输出为所述任务创建的子任务;将所述任务状态提示输入至所述对话模型后,若获取到所述任务的子任务,则执行所述子任务,直至所述任务执行完毕
。7.
一种对话模型训练方法,其特征在于,所述方法包括:获取训练数据集;所述训练数据集包括下述至少一个训练数据子集:基于兴趣点的信息构建的第一训练数据子集

基于地理知识构建的第二训练数据子集

基于地图领域的历史兴趣点搜索与导...

【专利技术属性】
技术研发人员:郭宁孙奇王浩李昕
申请(专利权)人:北京高德云信科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1