一种NLU任务的处理方法、系统、电子设备及存储介质技术方案

技术编号：32569893 阅读：39 留言：0更新日期：2022-03-09 16:56

本申请公开了一种NLU任务的处理方法，所述方法包括：获取预训练语言模型；其中，所述预训练语言模型为生成类语言模型；接收NLU任务，并对所述NLU任务对应的数据内容进行格式转换，得到目标文本；其中，所述目标文本包括文本内容语句和标签语句，所述标签语句为所述目标文本的最后一个句子，所述标签语句为待填写所述文本内容语句的标签词的句子；将所述目标文本输入所述预训练语言模型得到所述文本内容语句的标签词，根据所述文本内容语句的标签词生成所述NLU任务的处理结果。本申请能够提高生成类语言模型执对NLU任务的处理精准度。本申请还公开了一种NLU任务的处理系统、一种电子设备及一种存储介质，具有以上有益效果。具有以上有益效果。具有以上有益效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种NLU任务的处理方法、系统、电子设备及存储介质

[0001]本申请涉及自然语言处理
，特别涉及一种NLU任务的处理方法、系统、电子设备及存储介质。

技术介绍

[0002]自然语言处理技术的迅速发展催生了预训练语言模型(PLM，Pre
‑
trained Language Model)的诞生，其中比较具有代表性的模型结构是GPT和Bert。预训练语言模型的产生从某种意义上降低了自然语言处理模型的使用门槛，因为人们只要针对自己需要的下游任务对已有的预训练模型进行微调，而不需要从头开始训练模型，进而大大降低了自然语言模型的使用成本。由于预训练语言模型的开发者并不知道模型会被用来做什么样的下游任务，因此往往会使用大量语料、训练一个规模较大的模型，以确保模型获得执行不同任务的能力。
[0003]生成类语言模型(如GPT模型)为用于执行自然语言生成任务的预训练语言模型，生成类语言模型可以不改变参数，进行零样本学习(zero
‑
shot learning)和小样本学习(few
‑
shot learning)，但是在使用生成类语言模型处理NLU任务的精准度较差。
[0004]因此，如何提高生成类语言模型执对NLU任务的处理精准度是本领域技术人员目前需要解决的技术问题。

技术实现思路

[0005]本申请的目的是提供一种NLU任务的处理方法、系统、一种电子设备及一种存储介质，能够提高生成类语言模型执对NLU任务的处理精准度。
[0006...

【技术保护点】

【技术特征摘要】
1.一种NLU任务的处理方法，其特征在于，包括：获取预训练语言模型；其中，所述预训练语言模型为生成类语言模型；接收NLU任务，并对所述NLU任务对应的数据内容进行格式转换，得到目标文本；其中，所述目标文本包括文本内容语句和标签语句，所述标签语句为所述目标文本的最后一个句子，所述标签语句为待填写所述文本内容语句的标签词的句子；将所述目标文本输入所述预训练语言模型得到所述文本内容语句的标签词，根据所述文本内容语句的标签词生成所述NLU任务的处理结果。2.根据权利要求1所述NLU任务的处理方法，其特征在于，将所述目标文本输入所述预训练语言模型得到所述文本内容语句的标签词，包括：将所述目标文本输入所述预训练语言模型，得到所述预训练语言模型在所述标签语句中填写的预测标签词token；判断所述预测标签词token是否为所述文本内容语句的标准标签词；若是，则将所述预测标签词token设置为所述文本内容语句的标签词。3.根据权利要求2所述NLU任务的处理方法，其特征在于，在判断所述预测标签词token是否为所述文本内容语句的标准标签词之后，还包括：若所述预测标签词token不为所述文本内容语句的标准标签词，则利用所述预训练语言模型计算标签词集合中每一备选标签词出现在所述标签语句的概率；将概率最高的备选标签词设置为所述文本内容语句的标签词。4.根据权利要求1所述NLU任务的处理方法，其特征在于，所述对NLU任务对应的数据内容进行格式转换，得到目标文本，包括：确定所述数据内容中的文本内容语句和标准标签词；构建包括所述标准标签词的目标语句，并删除所述目标语句中的所述标准标签词得到所述标签...

【专利技术属性】
技术研发人员：于彤，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人