文本数据的处理方法、神经网络的训练方法以及相关设备技术

技术编号：31491634 阅读：34 留言：0更新日期：2021-12-18 12:28

本申请实施例公开一种文本数据的处理方法、神经网络的训练方法以及相关设备，该方法可用于人工智能领域的文本数据的处理领域中。方法包括：获取待处理文本，待处理文本包括多个字符；通过目标模型对待处理文本进行处理，得到预测结果，预测结果用于指示将待处理文本拆分为多个目标字符集合，预测结果还包括多个第一标签，一个第一标签用于指示一个目标字符集合的语义，多个第一标签用于确定待处理文本的意图。可以将叠字或语气助词拆分至另一个目标字符集合中，即使整个待处理文本中存在叠字或语气助词等，也能够实现对待处理文本的意图的理解，也即提供了一种更具有泛化能力的自然语言理解的方法。语言理解的方法。语言理解的方法。

全部详细技术资料下载

【技术实现步骤摘要】
文本数据的处理方法、神经网络的训练方法以及相关设备

[0001]本申请涉及人工智能领域，尤其涉及一种文本数据的处理方法、神经网络的训练方法以及相关设备。

技术介绍

[0002]人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
[0003]利用模型进行自然语言处理(natural language processing，NLP)是实现人工智能的重要手段之一，目前采用的自然语言理解的方法有基于模板匹配的方式，具体的，执行设备上可以配置有多个模板语句，以及每个模板语句所对应的意图，执行设备在获取到用户输入的待处理文本后，可以与多个模板语句进行匹配，若能够匹配到一致的语句，则能够获取到待处理文本的意图；若不能够匹配到一致的语句，则匹配失败。
[0004]但目前采取的模板匹配的方式比较死板，若用户输入的待处理文本是与模板语句近似的一种说法，例如比模板语句多一些叠字或语气助词等，都会导致匹配失败，继而无法获取到待处理文本的意图，因此，一种更具有泛化能力的自然语言理解的方法亟待推出。

技术实现思路

[0005]本申请实施例提供了一种文本数据的处理...

【技术保护点】

【技术特征摘要】
1.一种文本数据的处理方法，其特征在于，所述方法包括：获取待处理文本，所述待处理文本包括多个字符；通过目标模型对所述待处理文本进行处理，得到预测结果，其中，所述预测结果用于指示将所述待处理文本拆分为多个目标字符集合，每个所述目标字符集合包括至少一个字符，所述预测结果还包括多个第一标签，一个所述第一标签用于指示一个所述目标字符集合的语义，所述多个第一标签用于确定所述待处理文本的意图。2.根据权利要求1所述的方法，其特征在于，所述多个第一标签包括至少两级标签，所述至少两级标签包括父标签和子标签，所述父标签和所述子标签之间具有归属关系。3.根据权利要求1或2所述的方法，其特征在于，与所述待处理文本对应有N种拆分方式，所述N为大于或等于1的整数，所述预测结果用于指示与所述待处理文本对应的一种目标拆分方式，所述目标拆分方式归属于所述N种拆分方式，所述预测结果基于所述多个目标字符集合与所述多个第一标签之间的匹配度得到。4.根据权利要求3所述的方法，其特征在于，所述通过目标模型对所述待处理文本进行处理，得到预测结果，包括：将所述每个目标字符集合与第一数据集合中的多个字符串进行匹配，以确定与所述每个目标字符集合匹配的目标字符串，并从所述第一数据集合中获取与所述目标字符串对应的至少一个第二标签，一个字符串包括至少一个字符；根据所述每个目标字符集合和所述至少一个第二标签，通过所述目标模型将所述每个目标字符集合与所述第一数据集合中的多个标签进行匹配，以得到与所述每个目标字符集合匹配的所述第一标签。5.根据权利要求4所述的方法，其特征在于，在所述至少一个第二标签包括至少两个第二标签的情况下，所述从所述第一数据集合中获取与所述目标字符串对应的至少一个第二标签之后，所述方法还包括：根据所述待处理文本、所述目标字符集合和所述至少两个第二标签，通过所述目标模型生成目标指示信息，所述目标指示信息用于指示每个所述第二标签与所述目标字符集合匹配或不匹配；根据所述目标指示信息对所述至少两个第二标签进行筛选，得到至少一个筛选后的标签；所述根据所述目标字符集合和所述第二标签，通过所述目标模型将所述目标字符集合与所述第一数据集合中的多个标签进行匹配，包括：根据所述目标字符集合和所述至少一个筛选后的标签，通过所述目标模型将所述目标字符集合与所述第一数据集合中的多个标签进行匹配。6.一种神经网络的训练方法，其特征在于，所述方法包括：通过目标模型对待处理文本进行处理，得到预测结果，所述待处理文本包括多个字符，所述预测结果用于指示将所述待处理文本拆分为多个第一字符集合，每个所述第一字符集合包括至少一个字符，所述预测结果还包括多个第一标签，一个所述第一标签用于指示一个所述目标字符集合的语义，所述多个第一标签用于确定所述待处理文本的预测意图；根据目标损失函数，对所述目标模型进行训练，得到训练后的目标模型；其中，所述目标损失函数用于指示所述预测结果和与所述待处理文本对应的期望结果
之间的相似度，所述与所述待处理文本对应的期望结果用于指示将所述待处理文本拆分为多个第二字符集合，每个所述第二字符集合包括至少一个字符，所述与所述待处理文本对应的期望结果还包括多个期望标签，一个所述期望标签用于指示一个所述第二字符集合的语义，所述多个期望标签用于确定所述待处理文本的正确意图。7.根据权利要求6所述的方法，其特征在于，所述多个第一标签包括至少两级标签，所述至少两级标签包括父标签和子标签，所述父标签和所述子标签之间具有归属关系。8.根据权利要求6或7所述的方法，其特征在于，所述通过目标模型对待处理文本进行处理之前，所述方法还包括：获取目标数据子集合，所述目标数据子集合包括第一子集合和第二子集合，所述第一子集合包括第一字符串以及与所述第一字符串对应的第一期望标签，所述第二子集合包括第二字符串以及与所述第二字符串对应的第二期望标签；根据所述目标数据子集合，确定所述待处理文本和与所述待处理文本对应的所述期望结果，其中，所述待处理文本包括所述第一字符串和所述第二字符串，所述期望结果包括与所述第一字符串对应的所述第一期望标签和与所述第二字符串对应的所述第二期望标签。9.根据权利要求8所述的方法，其特征在于，与所述待处理文本对应的第三评分满足预设条件，所述第三评分用于指示所述待处理文本的质量。10.一种文本数据的处理方法，其特征在于，所述方法包括：获取目标数据子集合，所述目标数据子集合包括第一子集合和第二子集合，所述第一子集合包括第一字符串以及与所述第一字符串对应的第一期望标签，所述第二子集合包括第二字符串以及与所述第二字符串对应的第二期望标签；根据所述目标数据子集合，确定与目标模型对应的第二数据集合，其中，所述目标模型用于对输入的待处理文本进行语义理解，所述第二数据集合包括多个所述目标数据子集合，所述第二数据集合用于所述目标模型的训练阶段和/或所述目标模型的推理阶段；所述目标数据子集合用于指示与所述待处理文本对应的期望结果，所述期望结果用于指示将所述待处理文本拆分成至少两组字符串，所述至少两组字符串中包括所述第一字符串和所述第二字符串，所述正确结果还包括与所述第一字符串对应的所述第一期望标签和与所述第二字符串对应的所述第二期望标签。11.根据权利要求10所述的方法，其特征在于，所述方法还包括：通过显示界面获取与所述目标数据子集合对应的修改操作，所述修改操作包括如下任一种或多种操作：删除所述目标数据子集合中的字符串、更新所述目标数据子集合中的字符串的内容或者在所述目标数据子集合中增加新的字符串。12.根据权利要求10或11所述的方法，其特征在于，所述方法还包括：获取待处理文本，所述待处理文本包括多个字符；通过目标模型对所述待处理文本进行处理，得到预测结果，其中，所述预测结果用于指示将所述待处理文本拆分为多个目标字符集合，每个所述目标字符集合包括至少一个字符，所述预测结果还包括多个第一标签，一个所述第一标签用于指示一个所述目标字符集合的语义，所述多个第一标签用于确定所述待处理文本的意图。13.一种文本数据的处理装置，其特征在于，所述装置包括：获取模块，用于获取待处理文本，所述待处理文本包括多个字符；
处理模块，用于通过目标模型对所述待处理文本进行处理，得到预测结果，其中，所述预测结果用于指示将所述待处理文本拆分为多个目标字符集合，每个所述目标字符集合包括至少一个字符，所述预测结果还包括多个第一标签，一个所述第一标签用于指示一个所述目标字符集合的语义，所述多个第一标签用于确定所述待处理文本的意图。14.根据权利要求13所...

【专利技术属性】
技术研发人员：孟笑君，王雅圣，蒋欣，刘群，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人