文本处理方法、文本解析模型的训练方法及相关设备技术

技术编号:37674109 阅读:11 留言:0更新日期:2023-05-26 04:37
本申请公开了一种文本处理方法、文本解析模型的训练方法及相关设备。所述文本处理方法包括:获取待处理的第一用户对话文本;通过文本解析模型对第一用户对话文本进行解析,得到第一用户对话文本的意图信息和实体信息;基于意图信息和实体信息,确定第一用户对话文本对应的目标应答文本;文本解析模型包括编码模块和N个解析模块,N个解析模块与N个候选意图一一对应,编码模块用于对第一用户对话文本进行语义编码处理,得到第一用户对话文本的语义表示向量,第i个解析模块用于基于语义表示向量对第一用户对话文本进行解析,得到第i个候选意图对应的意图识别结果及实体识别结果,N为正整数,i为小于或等于N的正整数。i为小于或等于N的正整数。i为小于或等于N的正整数。

【技术实现步骤摘要】
文本处理方法、文本解析模型的训练方法及相关设备


[0001]本申请涉及文本处理
,尤其涉及一种文本处理方法、文本解析模型的训练方法及相关设备。

技术介绍

[0002]随着人工智能的快速发展,采用机器人进行自动应答已广泛应用于各行各业,比如在诸如智能客服等人机交互场景下,自动应答用户咨询的业务问题等。
[0003]相关技术中,针对用户的对话文本,通常是利用预先训练的意图识别模型识别用户对话文本的意图,然后基于识别出的意图对用户对话文本进行应答。但是,这种方式忽略了对话文本中能够表达用户真实需求的另一项关键信息——实体,因而无法准确理解用户的真实需求,应答准确率低。

技术实现思路

[0004]本申请实施例的目的提供一种文本处理方法、文本解析模型的训练方法及相关设备,以提升用户对话文本的应答方案的准确率。
[0005]为了实现上述目的,本申请实施例采用下述技术方案:
[0006]第一方面,本申请实施例提供一种文本处理方法,包括:
[0007]获取待处理的第一用户对话文本;
[0008]通过文本解析模型对所述第一用户对话文本进行解析,得到所述第一用户对话文本的意图信息和实体信息,所述意图信息包括N个候选意图分别对应的意图识别结果,所述实体信息包括所述N个候选意图分别对应的实体识别结果;
[0009]基于所述意图信息和所述实体信息,确定所述第一用户对话文本对应的目标应答文本;其中,所述文本解析模型包括编码模块和N个解析模块,所述N个解析模块与所述N个候选意图一一对应,所述编码模块用于对所述第一用户对话文本进行语义编码处理,得到所述第一用户对话文本的语义表示向量,第i个解析模块用于基于所述语义表示向量对所述第一用户对话文本进行解析,得到第i个候选意图对应的意图识别结果及实体识别结果,N为正整数,i为小于或等于N的正整数。
[0010]通过本申请实施例提供的文本处理方法,采用具有编码模块和N个解析模块的文本解析模型,N个解析模块与N个候选意图一一对应,每个解析模块可用于在所对应的一种候选意图下进行意图识别和实体识别,也即识别输入的文本是否具有所对应的一种候选意图并识别文本包含的对应于该候选意图下的实体;在此基础上,通过编码模块对第一用户对话文本进行语义编码,得到能够表示第一用户对话文本的语义的语义表示向量,再通过N个解析模块对待处理的第一用户对话文本进行解析,可以分别在N个候选意图下对第一用户对话文本进行意图识别和实体识别,得到第一用户对话文本在N个候选意图分别对应的意图识别结果和实体识别结果,由此同时完成意图识别、实体识别以及意图与实体的配对这三个任务;进一步,基于这些候选意图下分别对应的意图识别结果和实体识别结果,确定
第一用户对话文本对应的目标应答文本,相较于仅依据意图识别结果进行自动应答的方式,还充分考虑第一用户对话文本中与意图配对的实体,因而确定出的目标应答文本能够更准确地满足用户的真实需求,有利于提高应答准确率。
[0011]第二方面,本申请实施例提供一种文本解析模型的训练方法,包括:
[0012]获取训练数据,所述训练数据包括样本对话文本、所述样本对话文本的意图标签和实体标签,其中,所述意图标签用于表示所述样本对话文本的意图,所述实体标签用于表示所述意图在所述样本对话文本中对应的实体;
[0013]通过文本解析模型对所述样本对话文本进行解析,得到所述样本对话文本的意图信息和实体信息,其中,所述意图信息包括N个候选意图分别对应的意图识别结果,所述实体信息包括所述N个候选意图分别对应的实体识别结果;
[0014]基于所述样本对话文本的意图信息和意图标签、以及所述样本对话文本的实体信息和实体标签,对所述文本解析模型进行训练;其中,所述文本解析模型包括编码模块和N个解析模块,所述N个解析模块与所述N个候选意图一一对应,所述编码模块用于对所述样本对话文本进行语义编码处理,得到所述样本对话文本的语义表示向量,第i个解析模块用于基于所述语义表示向量对所述样本对话文本进行解析,得到第i个候选意图对应的意图识别结果及实体识别结果,N为正整数,i为小于或等于N的正整数。
[0015]通过本申请实施例提供的文本解析模型的训练方法,采用具有编码模块和N个解析模块的文本解析模型,N个解析模块与N个候选意图一一对应;在此基础上,基于样本对话文本的意图信息和意图标签、以及样本对话文本的实体信息和实体标签,对文本解析模型进行训练,由编码模块对样本对话文本进行语义编码,得到能够表示样本对话文本的语义的语义表示向量,再由每个解析模块基于样本对话文本的语义表示向量,从样本对话文本的意图标签学习样本对话文本的意图以及从样本对话文本的实体标签中学习样本对话文本包含的与该意图对应的实体,使得训练出的文本解析模型集成意图识别、实体识别以及意图与实体的配对等功能,进而训练出的文本解析模型能够用于准确理解用户的真实需求而解析出用户对话文本的意图及与该意图对应的实体,基于解析出的意图及其对应的实体对用户对话文本进行应答,有利于提高应答准确率。
[0016]第三方面,本申请实施例提供一种文本处理装置,包括:
[0017]第一获取单元,用于获取待处理的第一用户对话文本;
[0018]第一解析单元,用于通过文本解析模型对所述第一用户对话文本进行解析,得到所述第一用户对话文本的意图信息和实体信息,所述意图信息包括N个候选意图分别对应的意图识别结果,所述实体信息包括所述N个候选意图分别对应的实体识别结果;
[0019]第一确定单元,用于基于所述意图信息和所述实体信息,确定所述第一用户对话文本对应的目标应答文本;其中,所述文本解析模型包括编码模块和N个解析模块,所述N个解析模块与所述N个候选意图一一对应,所述编码模块用于对所述第一用户对话文本进行语义编码处理,得到所述第一用户对话文本的语义表示向量,第i个解析模块用于基于所述语义表示向量对所述第一用户对话文本进行解析,得到第i个候选意图对应的意图识别结果及实体识别结果,N为正整数,i为小于或等于N的正整数。
[0020]第四方面,本申请实施例提供一种文本解析模型的训练装置,包括:
[0021]第二获取单元,用于获取训练数据,所述训练数据包括样本对话文本、所述样本对
话文本的意图标签和实体标签,其中,所述意图标签用于表示所述样本对话文本的意图,所述实体标签用于表示所述意图在所述样本对话文本中对应的实体;
[0022]第二解析单元,用于通过文本解析模型对所述样本对话文本进行解析,得到所述样本对话文本的意图信息和实体信息,其中,所述意图信息包括N个候选意图分别对应的意图识别结果,所述实体信息包括所述N个候选意图分别对应的实体识别结果;
[0023]训练单元,用于基于所述样本对话文本的意图信息和意图标签、以及所述样本对话文本的实体信息和实体标签,对所述文本解析模型进行训练;其中,所述文本解析模型包括编码模块和N个解析模块,所述N个解析模块与所述N个候选意图一一对应,所述编码模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取待处理的第一用户对话文本;通过文本解析模型对所述第一用户对话文本进行解析,得到所述第一用户对话文本的意图信息和实体信息,所述意图信息包括N个候选意图分别对应的意图识别结果,所述实体信息包括所述N个候选意图分别对应的实体识别结果;基于所述意图信息和所述实体信息,确定所述第一用户对话文本对应的目标应答文本;其中,所述文本解析模型包括编码模块和N个解析模块,所述N个解析模块与所述N个候选意图一一对应,所述编码模块用于对所述第一用户对话文本进行语义编码处理,得到所述第一用户对话文本的语义表示向量,第i个解析模块用于基于所述语义表示向量对所述第一用户对话文本进行解析,得到第i个候选意图对应的意图识别结果及实体识别结果,N为正整数,i为小于或等于N的正整数。2.根据权利要求1所述的方法,其特征在于,所述语义表示向量包括所述第一用户对话文本的文本语义表示向量和所述第一用户对话文本中每个字符的字符语义表示向量,每个解析模块包括第一线性层、第二线性层和第三线性层;所述第i个解析模块的第一线性层,用于将所述文本语义表示向量转换为所述第i个候选意图的向量空间下的第一目标表示向量,以及将所述第一用户对话文本中每个字符的字符语义表示向量转换为所述第i个候选意图的向量空间下的第二目标表示向量;所述第i个解析模块的第二线性层,用于基于所述第i个候选意图的向量空间下的第一目标表示向量,对所述第一用户对话文本进行意图识别,得到所述第i个候选意图对应的意图识别结果;所述第i个解析模块的第三线性层,用于基于所述第一用户对话文本中每个字符在所述第i个候选意图的向量空间下的第二目标表示向量,对所述第一用户对话文本进行实体识别,得到所述第i个候选意图对应的实体识别结果。3.根据权利要求1所述的方法,其特征在于,所述N个候选意图包括第一候选意图和M个第二候选意图,M=N

1;所述N个解析模块包括第一解析模块和M个第二解析模块,所述第一解析模块与第一候选意图相对应,所述M个第二解析模块与所述M个第二候选意图一一对应;所述第一解析模块,用于基于所述语义表示向量对所述第一用户对话文本进行解析,得到所述第一候选意图对应的意图识别结果及实体识别结果,其中,所述第一候选意图对应的意图识别结果用于表示所述第一用户对话文本的意图是否包含所述M个第二候选意图中的至少一个;第j个第二解析模块,用于基于所述语义表示向量对所述第一用户对话文本进行解析,得到第j个候选意图对应的意图识别结果及实体识别结果,其中,所述第j个候选意图对应的意图识别结果用于表示所述第一用户对话文本的意图是否包含所述第j个候选意图,j为正整数,且1≤j≤M。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述基于所述意图信息和所述实体信息,确定所述第一用户对话文本对应的目标应答文本,包括:基于所述N个候选意图分别对应的意图识别结果,确定所述第一用户对话文本的目标
意图;基于所述N个候选意图分别对应的实体识别结果,确定所述目标意图在所述第一用户对话文本中对应的实体;基于所述目标意图及其在所述第一用户对话文本中对应的实体,从问答文本库中确定所述第一用户对话文本对应的目标应答文本。5.根据权利要求4所述的方法,其特征在于,所述基于所述目标意图及其在所述第一用户对话文本中对应的实体,从问答文本库中确定所述第一用户对话文本对应的目标应答文本,包括:若所述目标意图包含所述N个候选意图中的至少一个、且所述目标意图在所述第一用户对话文本中不具有对应的实体,则输出第一应答文本,所述第一应答文本用于引导输入包含实体的用户对话文本;通过所述文本解析模型对接收到的用户对话文本进行解析,得到所述接收到的用户对话文本的意图信息和实体信息;基于所述目标意图、所述接收到的用户对话文本的意图信息和实体信息,从所述问答文本库中确定所述第一用户对话文本对应的目标应答文本。6.根据权利要求4所述的方法,其特征在于,所述基于所述目标意图及其在所述第一用户对话文本中对应的实体,从问答文本库中确定所述第一用户对话文本对应的目标应答文本,包括:若所述目标意图不包含所述N个候选意图、且所述目标意图在所述第一用户对话文本中具有对应的实体,则输出第二应答文本,所述第二应答文本用于引导输入包含至少一个所述候选意图的用户对话文本;通过所述文本解析模型对接收到的用户对话文本进行解析,得到所述接收到的用户对话文本的意图信息和实体信息;基于所述目标意图在所述第一用户对话文本中对应的实体、所述接收到的用户对话文本的意图信息和实体信息,从所述问答文本库中确定所述第一用户对话文本对应的目标应答文本。7.根据权利要求4所述的方法,其特征在于,所述基于所述目标意图及其在所述第一用户对话文本中对应的实体,从问答文本库中确定所述第一用户对话文本对应的目标应答文本,包括:若所述目标意图不包含所述N个候选意图、且所述目标意图在所述第一用户对话文本中不具有对应的实体,则...

【专利技术属性】
技术研发人员:邓泽贵蒋宁肖冰马超
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1