【技术实现步骤摘要】
预训练模型中注意力矩阵的更新方法、装置及电子设备
[0001]本公开涉及计算机
,具体涉及自然语言处理、深度学习等人工智能
,尤其涉及一种预训练模型中注意力矩阵的更新方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,自然语言处理应用的也越来越广泛。
[0003]为了快速地获取与当前任务匹配的目标模型,可以基于当前任务对应的训练数据对预训练模型中每个自注意力层对应的注意力矩阵进行更新,以获取当前任务对应的目标模型。因此,如何减少对注意力矩阵进行更新的计算量,以节省计算资源成为重点的研究方向。
技术实现思路
[0004]本公开提供了一种预训练模型中注意力矩阵的更新方法、装置及电子设备。
[0005]本公开一方面,提供了一种预训练模型中注意力矩阵的更新方法,包括:
[0006]基于待掩码的第一注意力矩阵在预训练模型中的第一层数,生成第一掩码矩阵及第二掩码矩阵;
[0007]分别基于所述第一掩码矩阵及所述第二掩码矩阵,对所述第一注意力矩阵进行掩码,获取掩码后的第一模型及第二模型;
[0008]将当前任务对应的样本数据分别输入所述第一模型及所述第二模型,以获取所述第一掩码矩阵对应的第一奖励值及所述第二掩码矩阵对应的第二奖励值;
[0009]根据所述第一奖励值、所述第二奖励值、所述第一掩码矩阵、所述第二掩码矩阵及所述第一层数,生成第三掩码矩阵;
[0010]基于所述第三掩码矩阵,返回执行所述获取掩码后的模型的操作,直至 ...
【技术保护点】
【技术特征摘要】
1.一种预训练模型中注意力矩阵的更新方法,包括:基于待掩码的第一注意力矩阵在预训练模型中的第一层数,生成第一掩码矩阵及第二掩码矩阵;分别基于所述第一掩码矩阵及所述第二掩码矩阵,对所述第一注意力矩阵进行掩码,获取掩码后的第一模型及第二模型;将当前任务对应的样本数据分别输入所述第一模型及所述第二模型,以获取所述第一掩码矩阵对应的第一奖励值及所述第二掩码矩阵对应的第二奖励值;根据所述第一奖励值、所述第二奖励值、所述第一掩码矩阵、所述第二掩码矩阵及所述第一层数,生成第三掩码矩阵;基于所述第三掩码矩阵,返回执行所述获取掩码后的模型的操作,直至获取第一注意力矩阵在所述样本数据下的目标掩码矩阵。2.如权利要求1所述的方法,其中,所述基于待掩码的第一注意力矩阵在预训练模型中的第一层数,生成第一掩码矩阵及第二掩码矩阵,包括:基于所述第一注意力矩阵在预训练模型中的第一层数及所述预训练模型的结构,确定掩码矩阵的规模;基于所述掩码矩阵的规模,生成所述第一掩码矩阵及所述第二掩码矩阵。3.如权利要求1所述的方法,其中,所述根据所述第一奖励值、所述第二奖励值、所述第一掩码矩阵、所述第二掩码矩阵及所述第一层数,生成第三掩码矩阵,包括:根据所述第二掩码矩阵与所述第一掩码矩阵中各对应元素间的差值,确定掩码矩阵中每个元素对应的第一更新方向;根据所述第二奖励值与所述第一奖励值间的差值,确定所述第一更新方向的奖励值;根据所述第一更新方向的奖励值,从所述第一掩码矩阵及所述第二掩码矩阵中确定出参考掩码矩阵及第二更新方向;基于所述参考掩码矩阵、所述第二更新方向及所述第一层数,生成所述第三掩码矩阵。4.如权利要求1所述的方法,其中,所述基于所述第三掩码矩阵,返回执行所述获取掩码后的模型的操作,直至获取第一注意力矩阵在所述样本数据下的目标掩码矩阵,包括:在第n掩码矩阵对应的第n奖励值与相邻的前L个奖励值间的差值小于第一阈值的情况,确定第n
‑
L掩码矩阵为所述第一注意力矩阵在所述样本数据下的目标掩码矩阵,其中,n为正整数,L为小于n的正整数。5.如权利要求1
‑
4任一所述的方法,其中,在所述基于所述第三掩码矩阵,返回执行所述获取掩码后的模型的操作,直至获取第一注意力矩阵在所述样本数据下的目标掩码矩阵之后,还包括:基于所述目标掩码矩阵,对所述第一注意力矩阵进行掩码,获取掩码后的第一目标模型;将所述当前任务对应的校验数据,输入所述第一目标模型,以获取所述校验数据对应的第一输出结果;在所述第一输出结果与所述校验数据对应的标注结果间的第一匹配度小于第二阈值的情况下,确定所述第一目标模型中待掩码的第二注意力矩阵;基于所述第二注意力矩阵在所述第一目标模型中的第二层数,返回执行上述生成第一
掩码矩阵及第二掩码矩阵的操作,直至确定所述第二注意力矩阵在所述样本数据下的目标掩码矩阵。6.如权利要求5所述的方法,其中,所述确定所述第一目标模型中待掩码的第二注意力矩阵,包括:将所述当前任务对应的校验数据,输入所述预训练模型,以获取所述校验数据对应的第二输出结果;确定所述第二输出结果与所述标注结果间的第二匹配度;根据所述第二匹配度与所述第一匹配度间的差值,确定所述第二注意力矩阵与所述第一注意力矩阵在所述第一目标模型中的相对位置;基于所述相对位置及所述第一层数,确定所述第二注意力矩阵在所述第一目标模型中的第二层数;基于所述第二层数,确定所述第二注意力矩阵。7.如权利要求6所述的方法,其中,所述根据所述第二匹配度与所述第一匹配度间的差值,确定所述第二注意力矩阵与所述第一注意力矩阵在所述第一目标模型中的相对位置,包括:在所述第二匹配度与所述第一匹配度间的差值大于或等于第三阈值的情况下,确定所述第一注意力矩阵与所述第二注意力矩阵在所述第一目标模型中相邻;或者,在所述第二匹配度与所述第一匹配度间的差值小于所述第三阈值的情况下,确定所述第二注意力矩阵与所述第一目标模型的输出层之间间隔的层数,与所述第一注意力矩阵与所述第一目标模型的输入层之间间隔的层数相同。8.一种预训练模型中注意力矩阵的更新装置,包括:第一生成模块,用于基于待掩码的第一注意力矩阵在预训练模型中的第一层数,生成第一掩码矩阵及第二掩...
【专利技术属性】
技术研发人员:柴业坤,王硕寰,孙宇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。