文本处理方法、文本解析模型的训练方法及相关设备技术

技术编号：37674109 阅读：11 留言：0更新日期：2023-05-26 04:37

本申请公开了一种文本处理方法、文本解析模型的训练方法及相关设备。所述文本处理方法包括：获取待处理的第一用户对话文本；通过文本解析模型对第一用户对话文本进行解析，得到第一用户对话文本的意图信息和实体信息；基于意图信息和实体信息，确定第一用户对话文本对应的目标应答文本；文本解析模型包括编码模块和N个解析模块，N个解析模块与N个候选意图一一对应，编码模块用于对第一用户对话文本进行语义编码处理，得到第一用户对话文本的语义表示向量，第i个解析模块用于基于语义表示向量对第一用户对话文本进行解析，得到第i个候选意图对应的意图识别结果及实体识别结果，N为正整数，i为小于或等于N的正整数。i为小于或等于N的正整数。i为小于或等于N的正整数。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法、文本解析模型的训练方法及相关设备

[0001]本申请涉及文本处理
，尤其涉及一种文本处理方法、文本解析模型的训练方法及相关设备。

技术介绍

[0002]随着人工智能的快速发展，采用机器人进行自动应答已广泛应用于各行各业，比如在诸如智能客服等人机交互场景下，自动应答用户咨询的业务问题等。
[0003]相关技术中，针对用户的对话文本，通常是利用预先训练的意图识别模型识别用户对话文本的意图，然后基于识别出的意图对用户对话文本进行应答。但是，这种方式忽略了对话文本中能够表达用户真实需求的另一项关键信息——实体，因而无法准确理解用户的真实需求，应答准确率低。

技术实现思路

[0004]本申请实施例的目的提供一种文本处理方法、文本解析模型的训练方法及相关设备，以提升用户对话文本的应答方案的准确率。
[0005]为了实现上述目的，本申请实施例采用下述技术方案：
[0006]第一方面，本申请实施例提供一种文本处理方法，包括：
[0007]获取待处理的第一用户对话文本；
[0008]通过文本解析模型对所述第一用户对话文本进行解析，得到所述第一用户对话文本的意图信息和实体信息，所述意图信息包括N个候选意图分别对应的意图识别结果，所述实体信息包括所述N个候选意图分别对应的实体识别结果；
[0009]基于所述意图信息和所述实体信息，确定所述第一用户对话文本对应的目标应答文本；其中，所述文本解析模型包括编码模块和N个解析模块，所述N个解析模块与所述N个候选意图...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法，其特征在于，包括：获取待处理的第一用户对话文本；通过文本解析模型对所述第一用户对话文本进行解析，得到所述第一用户对话文本的意图信息和实体信息，所述意图信息包括N个候选意图分别对应的意图识别结果，所述实体信息包括所述N个候选意图分别对应的实体识别结果；基于所述意图信息和所述实体信息，确定所述第一用户对话文本对应的目标应答文本；其中，所述文本解析模型包括编码模块和N个解析模块，所述N个解析模块与所述N个候选意图一一对应，所述编码模块用于对所述第一用户对话文本进行语义编码处理，得到所述第一用户对话文本的语义表示向量，第i个解析模块用于基于所述语义表示向量对所述第一用户对话文本进行解析，得到第i个候选意图对应的意图识别结果及实体识别结果，N为正整数，i为小于或等于N的正整数。2.根据权利要求1所述的方法，其特征在于，所述语义表示向量包括所述第一用户对话文本的文本语义表示向量和所述第一用户对话文本中每个字符的字符语义表示向量，每个解析模块包括第一线性层、第二线性层和第三线性层；所述第i个解析模块的第一线性层，用于将所述文本语义表示向量转换为所述第i个候选意图的向量空间下的第一目标表示向量，以及将所述第一用户对话文本中每个字符的字符语义表示向量转换为所述第i个候选意图的向量空间下的第二目标表示向量；所述第i个解析模块的第二线性层，用于基于所述第i个候选意图的向量空间下的第一目标表示向量，对所述第一用户对话文本进行意图识别，得到所述第i个候选意图对应的意图识别结果；所述第i个解析模块的第三线性层，用于基于所述第一用户对话文本中每个字符在所述第i个候选意图的向量空间下的第二目标表示向量，对所述第一用户对话文本进行实体识别，得到所述第i个候选意图对应的实体识别结果。3.根据权利要求1所述的方法，其特征在于，所述N个候选意图包括第一候选意图和M个第二候选意图，M＝N
‑
1；所述N个解析模块包括第一解析模块和M个第二解析模块，所述第一解析模块与第一候选意图相对应，所述M个第二解析模块与所述M个第二候选意图一一对应；所述第一解析模块，用于基于所述语义表示向量对所述第一用户对话文本进行解析，得到所述第一候选意图对应的意图识别结果及实体识别结果，其中，所述第一候选意图对应的意图识别结果用于表示所述第一用户对话文本的意图是否包含所述M个第二候选意图中的至少一个；第j个第二解析模块，用于基于所述语义表示向量对所述第一用户对话文本进行解析，得到第j个候选意图对应的意图识别结果及实体识别结果，其中，所述第j个候选意图对应的意图识别结果用于表示所述第一用户对话文本的意图是否包含所述第j个候选意图，j为正整数，且1≤j≤M。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述基于所述意图信息和所述实体信息，确定所述第一用户对话文本对应的目标应答文本，包括：基于所述N个候选意图分别对应的意图识别结果，确定所述第一用户对话文本的目标
意图；基于所述N个候选意图分别对应的实体识别结果，确定所述目标意图在所述第一用户对话文本中对应的实体；基于所述目标意图及其在所述第一用户对话文本中对应的实体，从问答文本库中确定所述第一用户对话文本对应的目标应答文本。5.根据权利要求4所述的方法，其特征在于，所述基于所述目标意图及其在所述第一用户对话文本中对应的实体，从问答文本库中确定所述第一用户对话文本对应的目标应答文本，包括：若所述目标意图包含所述N个候选意图中的至少一个、且所述目标意图在所述第一用户对话文本中不具有对应的实体，则输出第一应答文本，所述第一应答文本用于引导输入包含实体的用户对话文本；通过所述文本解析模型对接收到的用户对话文本进行解析，得到所述接收到的用户对话文本的意图信息和实体信息；基于所述目标意图、所述接收到的用户对话文本的意图信息和实体信息，从所述问答文本库中确定所述第一用户对话文本对应的目标应答文本。6.根据权利要求4所述的方法，其特征在于，所述基于所述目标意图及其在所述第一用户对话文本中对应的实体，从问答文本库中确定所述第一用户对话文本对应的目标应答文本，包括：若所述目标意图不包含所述N个候选意图、且所述目标意图在所述第一用户对话文本中具有对应的实体，则输出第二应答文本，所述第二应答文本用于引导输入包含至少一个所述候选意图的用户对话文本；通过所述文本解析模型对接收到的用户对话文本进行解析，得到所述接收到的用户对话文本的意图信息和实体信息；基于所述目标意图在所述第一用户对话文本中对应的实体、所述接收到的用户对话文本的意图信息和实体信息，从所述问答文本库中确定所述第一用户对话文本对应的目标应答文本。7.根据权利要求4所述的方法，其特征在于，所述基于所述目标意图及其在所述第一用户对话文本中对应的实体，从问答文本库中确定所述第一用户对话文本对应的目标应答文本，包括：若所述目标意图不包含所述N个候选意图、且所述目标意图在所述第一用户对话文本中不具有对应的实体，则...

【专利技术属性】
技术研发人员：邓泽贵，蒋宁，肖冰，马超，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人