System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对抗信息的生成方法、装置、计算机设备和存储介质制造方法及图纸_技高网

对抗信息的生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40352293 阅读:4 留言:0更新日期:2024-02-09 14:36
本申请涉及一种对抗信息的生成方法、装置、计算机设备、存储介质和计算机程序产品。可应用于云技术、人工智能等场景,所述方法包括:当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。采用本方法能够提高语言模型对语言信息处理任务的处理效果。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及一种对抗信息的生成方法、装置、计算机设备和存储介质


技术介绍

1、在自然语言处理任务中,通常采用基于对抗样本的文本对抗攻击方法来评估语言模型的鲁棒性或者训练高鲁棒性的语言处理模型。

2、目前获取对抗样本的方式主要是在样本上添加扰动,然而由于扰动添加的技术限制,使得所添加的扰动无法使模型具备复杂语义的理解能力,从而导致语言模型的语言信息处理任务的处理效果较差。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高语言信息处理任务的处理效果的对抗信息的生成方法、装置、计算机设备和存储介质。

2、第一方面,本申请提供了一种对抗信息的生成方法。所述方法包括:

3、当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;

4、对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;

5、对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;

6、基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。

7、第二方面,本申请还提供了一种对抗信息的生成装置。所述装置包括:

8、对抗指示信息选取模块,用于当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;

9、语义编码模块,用于对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;

10、向量预测模块,用于对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;

11、信息生成模块,用于基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。

12、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

13、当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;

14、对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;

15、对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;

16、基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。

17、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

18、当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;

19、对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;

20、对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;

21、基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。

22、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

23、当接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息;

24、对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量;

25、对所述语义向量和所述拼接信息进行注意力处理,得到预测向量;

26、基于所述预测向量生成所述目标对抗指示信息所指示对抗类型下的对抗信息,所述对抗信息用于训练第一语言模型,所述第一语言模型用于执行语言信息处理任务。

27、上述对抗信息的生成方法、装置、计算机设备、存储介质和计算机程序产品,通过预先构建包含至少一个候选对抗指示信息的对抗指示库,每个候选对抗指示信息用于指示生成相应对抗类型下对抗信息,从而可以在接收到针对原始信息的对抗信息生成任务时,从对抗指示库的至少一个候选对抗指示信息中选取目标对抗指示信息,通过对原始信息和目标对抗指示信息的拼接信息进行编解码,可以实现目标对抗指示信息指导对抗信息的生成,最终得到符合预期的对抗信息;另外生成对抗信息的过程中,通过对拼接信息进行语义编码,可以得到携带了上下文语义的语义向量,通过对语义向量和拼接信息进行注意力处理,可以实现在对抗信息生成过程中让目标对抗指示信息充分发挥引导作用,从而得到更加示信息生成符合预期的对抗信息;此外,针对同一个原始信息可以采用不同的候选对抗指不同对抗类型下的对抗信息,提高了对抗信息的多样性,使用准确且丰富的对抗信息训练第一语言模型,使得第一语言模型可以更好地适应和处理各种复杂和挑战性的语言信息,从而提高了第一语言模型对语言信息处理任务的处理效果。

本文档来自技高网...

【技术保护点】

1.一种对抗信息的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述方法,其特征在于,所述对所述文本信息进行可用性分类,得到所述文本信息的分类类别,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述分类类别为可用指示类别的所述文本信息作为候选对抗指示信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述编码器包括M个编码层,所述解码器包括N个解码层,M和N均为大于或等于2的正整数;所述通过第二语言模型的编码器对所述拼接信息进行语义编码,得到语义向量,包括:

7.根据权利要求6所述的方法,其特征在于,所述编码层包括第一注意力子层、第一归一化子层、前馈网络子层和第二归一化子层;所述通过所述M个编码层对所述拼接信息进行语义编码,并在语义编码过程中,将每个编码层所得的语义编码结果作为下一个编码层的输入数据进行语义编码,得到语义向量,包括:

8.根据权利要求6所述的方法,其特征在于,所述解码层包括第二注意力子层、第三归一化子层、第三注意力子层、第四归一化子层、前馈网络子层;所述通过所述N个解码层对所述语义向量和所述拼接信息进行注意力处理,并在注意力处理的过程中,将每个解码层所得的注意力处理结果和所述语义向量作为下一个解码层的输入数据进行注意力处理,得到预测向量,包括:

9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:

10.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:

11.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:

12.一种对抗信息的生成装置,其特征在于,所述装置包括:

13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。

15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种对抗信息的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述方法,其特征在于,所述对所述文本信息进行可用性分类,得到所述文本信息的分类类别,包括:

4.根据权利要求3所述的方法,其特征在于,所述将所述分类类别为可用指示类别的所述文本信息作为候选对抗指示信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述对拼接所述原始信息和所述目标对抗指示信息所得到的拼接信息进行语义编码,得到语义向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述编码器包括m个编码层,所述解码器包括n个解码层,m和n均为大于或等于2的正整数;所述通过第二语言模型的编码器对所述拼接信息进行语义编码,得到语义向量,包括:

7.根据权利要求6所述的方法,其特征在于,所述编码层包括第一注意力子层、第一归一化子层、前馈网络子层和第二归一化子层;所述通过所述m个编码层对所述拼接信息进行语义编码,并在语义编码过程中,将每个编码层所得的语义编码结果作为下一个编码层的输入数据进行语义编码,得到语义向量,包括:

8.根据权利要求6所述的方法,其特征...

【专利技术属性】
技术研发人员:陆笛
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1