预训练掩码语言模型全流程自动纠偏方法、装置及介质制造方法及图纸

技术编号：41328711 阅读：34 留言：0更新日期：2024-05-13 15:06

本发明专利技术公开了一种预训练掩码语言模型全流程自动纠偏方法、装置及介质，属于人工智能下的自然语言处理分支领域。本发明专利技术从公共知识库中获取每个主题的短语，基于预训练掩码语言模型MLM筛选出与每个主题的种子短语最相似的多个短语，构成主题短语集合；基于包含多个掩码标记的提示和MLM，计算多token粒度的刻板印象短语的概率分布，并根据概率分布差异计算针对每个输入提示的损失，并获取最大化损失的有偏见的提示；通过最小化针对每个输入提示的损失，对MLM进行微调；利用微调后的MLM对输入的自然语言进行自动纠偏。本发明专利技术通过自动化的方式来一定程度减轻大型预训练掩码语言模型的偏见问题，降低人工纠正偏见的数据成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术提出一种预训练掩码语言模型全流程自动纠偏方法、装置及介质，属于人工智能下的自然语言处理分支领域。

技术介绍

1、现有技术中与本专利技术最相近似的实现方案是发表于annual meeting of theassociation for computational linguistics 2022(acl’22)的《auto-debias:debiasing masked language models with automated biased prompts》[14]，其大体流程框架如图1所示。

2、auto-debias针对的问题是英文掩码预训练语言模型中出现的性别/种族在职业、学科方面上的偏见现象，其解决方案是：

3、(1)首先auto-debias定义了“属性词-偏见词”对应关系，其中属性词c为性别或者种族相关词，且往往呈现m元组(此处是2元组)的形式，如“(he,she)”或者“(europeanamerican,african american)”；偏见词则是类似职业或者学科相关词，如“foo...

【技术保护点】

1.一种预训练掩码语言模型全流程自动纠偏方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，步骤1)中从公共知识库中获取每个主题的短语时，利用MLM过滤掉与刻板印象的种子短语具有语义相似性的超链接短语。

3.如权利要求1所述的方法，其特征在于，步骤1)中基于MLM筛选出与每个主题的种子短语最相似的多个短语的步骤包括：

4.如权利要求3所述的方法，其特征在于，步骤1)中利用MLM计算每个短语的嵌入的式子为：

5.如权利要求1所述的方法，其特征在于，步骤2)中包含多个掩码标记的提示的表达式为：

<...

【技术特征摘要】

1.一种预训练掩码语言模型全流程自动纠偏方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，步骤1)中从公共知识库中获取每个主题的短语时，利用mlm过滤掉与刻板印象的种子短语具有语义相似性的超链接短语。

3.如权利要求1所述的方法，其特征在于，步骤1)中基于mlm筛选出与每个主题的种子短语最相似的多个短语的步骤包括：

4.如权利要求3所述的方法，其特征在于，步骤1)中利用mlm计算每个短语的嵌入的式子为：

5.如权利要求1所述的方法，其特征在于，步骤2)中包含多个掩码标记的提示的表达式为：

6.如权利要求5所述的方法，...

【专利技术属性】
技术研发人员：张潇丹，石秉康，刘总真，吕红蕾，王仕杰，胡静远，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人