一种基于局部扰动的对抗样本防御算法制造技术

技术编号：27743545 阅读：14 留言：0更新日期：2021-03-19 13:37

本发明专利技术公开了一种基于局部扰动的对抗样本防御方法DAT‑LP。该算法属于对抗训练这一类型，用于提升模型鲁棒性抵御对抗文本的攻击，维护文本分类模型的可信处理。该算法基于对抗训练提出改进和训练技巧，用于进一步提升对抗训练的效果。主要概括为将之前的对抗训练方法从全局的扰动变为了局部的扰动，局部区域扰动的定义是屏蔽掉训练资料中一些分类倾向明显的词汇。DAT‑LP让模型能够从文本的整体语义学习到更多信息，避免一些词汇在模型训练中扮演了过重的角色从而对模型性能产生负面影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于局部扰动的对抗样本防御算法
本专利技术属于自然语言处理领域，涉及面对文本类型对抗样本攻击时的防御算法，该算法改进了对抗训练方法，从全局性扰动变为有针对性的局部扰动，利用对抗样本来确定局部区域，提升了模型处理对抗样本的能力。
技术介绍
人工智能(ArtificialIntelligence,AI)的概念提出以来，研究者们不断探索它的理论基础及其在交通、医疗、教育等方面的应用，而机器学习(MachineLearning,ML)与深度学习(DeepLearning,DL)则是如今最重要的AI技术。其中，DL中的深度神经网络(DeepNeuralNetwork,DNN)的研究近年来得到了迅猛的发展，在多个领域取得了优异的效果，例如自动驾驶、人脸识别、文本任务、智慧楼宇等等。但最新的研究指出，DNN随着自身结构复杂性的提升，表现为高度的非线性化。虽然模型的准确度日益提高，但自身的鲁棒性并没有得到很好的保障。恶意攻击者可以在原始输入样本的基础上添加少量的扰动生成对抗样本，从而诱导模型做出错误的判断，但人眼却无法辨别出原始样本与对抗样本之间的细微差异。这种现象引起了研究人员关于神经网络鲁棒性的担忧，暴露出神经网络在进一步被大规模应用到实际生活中存在着一定风险，尤其是一些安全性敏感的领域，例如在自动驾驶中，不法分子通过对交通指示牌做出人眼不可察觉的细微涂改，诱发无人车做出错误的驾驶行为从而引发交通事故；在垃圾短信识别等敏感类文本任务中，恶意信息的传播者构造对抗样本来规避原系统的检测。对抗样本的出现同时也给文本类任务造...

【技术保护点】
1.一种基于局部扰动的对抗样本防御算法。其特征在于：/n具备识别对抗特点的文本输入(1)，在建立内部神经网络模型的阶段，使用了对抗训练提升泛化能力(2)，以此建立垃圾短信识别系统(3)在外部系统或者用户提交了服务请求后(4)，系统能够准确地判别输入文本内容的性质(5)，为现有的横向项目短信平台提供净化环境的功能/n

【技术特征摘要】
1.一种基于局部扰动的对抗样本防御算法。其特征在于：
具备识别对抗特点的文本输入(1)，在建立内部神经网络模型的阶段，使用了对抗训练提升泛化能力(2)，以此建立垃圾短信识别系统(3)在外部系统或者用户提交了服务请求后(4)，系统能够准确地判别输入文本内容的性质(5)，为现有的横向项目短信平台提供净化环境的功能

2.根据权利要求1所述的一种基于局部扰动的对抗样本防御算法统，其特征在于：在训练过程中，不仅仅用原始输入文本作为训练资料，在此基础上引入了对抗训练的思想。将扰动添加到了原输入上。

3.根据权...

【专利技术属性】
技术研发人员：陈彦如，石静，牟志，王浩，魏亮雄，邹可欣，张媛媛，梁刚，许春，张磊，陈良银，
申请(专利权)人：成都易书桥科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人