针对大规模预训练语言模型的提示学习方法和交互系统技术方案

技术编号：38585925 阅读：10 留言：0更新日期：2023-08-26 23:28

本公开涉及一种针对规模预训练语言模型的提示学习方法和利用该操作方法的交互系统。所述方法包括：构造上下文示例并送入经预训练的所述PLM用于提示学习；以及使用学习过所述上下文示例的所述PLM执行针对目标示例的测试，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调，以获取预训练的所述PLM。本公开在业内首次提出了面向大规模预训练语言模型的知识预训练算法，为构建应用于各个领域的大规模知识模型奠定基础。具体地，该方法提出了可以单独或结合使用的新颖的基于事实知识注入的预训练任务，并且发现对目标示例的明智选择和利用知识库中知识先验的校准能够进一步提升模型表现。校准能够进一步提升模型表现。校准能够进一步提升模型表现。

全部详细技术资料下载

【技术实现步骤摘要】
针对大规模预训练语言模型的提示学习方法和交互系统

[0001]本公开涉及一种针对大规模预训练语言模型的提示学习方法和利用该方法的交互系统。

技术介绍

[0002]大规模预训练语言模型(PLM)，例如参数量达到1B甚至以上的模型，通过将一些标记的训练例作为基于文本的提示进行调整，以实现上下文学习(ICL)，从而无需更新参数并实现具有竞争力的性能。现有的研究已经探索了影响ICL性能的诸多方面。然而所有这些局限在ICL框架内的研究，对应模型性能的提升都有限。
[0003]为此需要一种改进的、能够进一步提升大规模预训练语言模型性能的方法。

技术实现思路

[0004]本公开要解决的一个技术问题是提供一种针对大规模预训练语言模型的提示学习方法和利用该方法的交互系统。该方法在业内首次提出了面向大规模预训练语言模型的知识预训练算法，为构建应用于各个领域的大规模知识模型奠定基础。具体地，该方法提出了可以单独或结合使用的新颖的基于事实知识注入的预训练任务，并且发现对目标示例的明智选择和利用知识库中知识先验的校准能够进一步提升模型表现。
[0005]根据本公开的第一个方面，提供了一种大规模预训练语言模型PLM操作方法，包括：构造上下文示例并送入经预训练的所述PLM用于提示学习；以及使用学习过所述上下文示例的所述PLM执行针对目标示例的测试，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调，以获取预训练的所述PLM。
[0006]可选地，使用将实体知识注入所述PLM的预训练任务...

【技术保护点】

【技术特征摘要】
1.一种针对大规模预训练语言模型PLM的提示学习方法，包括：构造上下文示例并送入经预训练的所述PLM用于提示学习；以及使用学习过所述上下文示例的所述PLM执行针对目标示例的测试，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调，以获取预训练的所述PLM。2.如权利要求1所述的方法，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调还包括：将分类标签作为特殊实体进行所述实体知识注入。3.如权利要求1所述的方法，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调包括：使用掩码实体预测任务对所述PLM的参数进行微调，其中，所述掩码实体预测任务对输入文本中的实体进行掩码，并且基于所述PLM输出的实体标记与被掩码实体对应的真实实体标记之间差异产生的损失对所述PLM的参数进行微调。4.如权利要求1所述的方法，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调包括：使用实体描述生成任务对所述PLM的参数进行微调，其中，所述实体描述生成任务用于：构造包括实体模板、输入文本中的所有实体和文本模板的前缀文本，并将原始文本作为后缀文本；对后缀文本中的实体进行掩码；基于所述所述PLM针对给定实体输出的文本表述与原始文本之间差异产生的损失对所述PLM的参数进行微调。5.如权利要求1所述的方法，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调包括：使用知识问答任务对所述PLM的参数进行微调，其中，所述知识问答任务用于：对输入文本中的实体进行掩码；基于知识库构造包含被掩码实体的三元组；将所述三元组的信息转换为预测所述三元组中另一个实体的问题；基于所述PLM输出的答案标记与所述另一个实体对应标记之间差异产生的损失对所述PLM的参数进行微调。6.如权利要求3
‑
5中任一项所述的方法，其中，使用将实体知识注入所述PLM的预训练任务对所述PLM的参数进行微调包括：从同一任务中随机选择多个示例来形成训练实例，直到达到最大序列长度；、计算所述PLM输出...

【专利技术属性】
技术研发人员：汪诚愚，黄俊，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人