一种基于渲染的对抗样本生成方法技术

技术编号:39049348 阅读:25 留言:0更新日期:2023-10-10 12:02
本发明专利技术提供了一种基于渲染的对抗样本生成方法,包括:S1,评估各个词语对于文本分类模型输出结果的影响力;选择对模型有一定影响力的词语分类存储,生成各类重点词表;S2,对于文本标题中的内容,采用基于视觉无察觉的插入的修改方式;S3,对于多段落文本开头段和结尾段中的内容,采用基于视觉无察觉的分隔修改方式;S4,对于多段落文本的中间段和单段落文本的段首句、段尾句中的内容,采用基于视觉无察觉的逆序修改方式;S5,对于多段落文本的中间段和单段落文本除首尾外的中间句中内容,采用基于视觉无察觉的替换修改方式。本发明专利技术为文本对抗样本的语义保留和不可区分性,以及提高文本分类模型的安全性提供了有益的参考。本分类模型的安全性提供了有益的参考。本分类模型的安全性提供了有益的参考。

【技术实现步骤摘要】
一种基于渲染的对抗样本生成方法


[0001]本专利技术涉及人工智能领域,具体涉及一种基于渲染的对抗样本生成方法。

技术介绍

[0002]对抗样本是指:在输入的样本中进行修改,使得模型高概率给出错误的输出结果的同时,样本依然能被人类使用者正确的理解和使用。在图像领域已经存在许多对抗样本的探索,但是在文本领域构建对抗样本在目前还存在挑战:首先,由于文本空间是离散的,采用图像沿梯度方向进行扰动方法的难度很高;其次,现有的文本对抗样本生成方法多对字和词语使用插入、删除、替换的手段,或者是句子级别的转述方法。这些方法难以保证生成样本的流畅性,使样本产生人类可以感知的语义和视觉信息变化,使人类容易曲解样本含义,从而影响人类使用者还原样本信息。
[0003]Unicode支持大部分语言,可以使得相同的渲染呈现效果由各种不同的编码序列表示,也使得其暴露出一些安全问题如同形异议,双向显示,以及数字歧义等。而这些基于渲染的问题现有的文本分类模型在编码时少有考虑。

技术实现思路

[0004]本专利技术旨在提供一种基于渲染的对抗样本生成方法,利本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于渲染的对抗样本生成方法,其特征在于,包括:S1,采用置信度方法,对训练集中每条样本中的每个词语评分,以评估各个词语对于文本分类模型输出结果的影响力;选择对模型有一定影响力的词语分类存储,生成各类重点词表;S2,基于重点词表,对于一段文本首先处理文本标题中的内容,采用基于视觉无察觉的插入的修改方式,匹配样本标题中包含的修改表中的词语作为被插入词,在插入词的每个字或字符后面各插入一个不可见的退格控制字符;S3,基于重点词表,对于多段落文本开头段和结尾段中的内容,采用基于视觉无察觉的分隔修改方式,匹配样本开头段和结尾段中包含的修改表中的词语作为被分隔词,将零宽空格字符随机插入到分隔词除首尾外的任意位置;S4,基于重点词表,对于多段落文本的中间段和单段落文本的段首句、段尾句中的内容,采用基于视觉无察觉的逆序修改方式,匹配样本中间段和单段落段首句、段尾句中包含的修改表中的词语作为被逆序词,使用不可见控制字符完成逆序;S5,基于重点词表,对于多段落文本的中间段和单段落文本除首尾外的中间句中内容,采用基于视觉无察觉的替换修改方式,匹配样本中间段和单段落文本除首尾外的中间句中包含的修改表中的词语作为被替换词,使用形近字替换。2.根据权利要求1所述的一种基于渲染的对抗样本生成方法,其特征在于,S1具体包括:S11,将训练集中的每条样本作为探测样本,对于每一个输入模型的探测样本,通过模型输出判断探测样本类别,并采用置信度评估方法得到的样本中每个词语对于文本分类模型贡献程度的得分C
F
;S12,以对于模型的贡献程度分数从大到小的顺序排列探测样本中的词语,并从每个样本中,提取出得分最高的三个词语,存入样本对应类别的初始词表;S13,处理所有的探测样本,分别对得到的各个类别的初始词表进行去重;并在每个类别的初始词表中,只存储该初始词表与其他类别初始词表的差集,构成各类重点词表,其中存储的全部是对各类数据分类置信度贡献重大的词语。3.根据权利要求2所述的一种基于渲染的对抗样本生成方法,其特征在于,S11中每个词语对于文本分类模型贡献程度的得分C
F
具体计算包括:其中,F表示模型,x
i
表示第i个原始样本,y
...

【专利技术属性】
技术研发人员:李强李昊聪张浩宇王伟
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1