对抗样本生成方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:22388117 阅读:45 留言:0更新日期:2019-10-29 06:44
本公开的实施例公开了对抗样本生成方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对于训练样本集中的训练样本,执行以下生成步骤,其中,训练样本包括样本文本和该样本文本对应的标注信息:生成该样本文本对应的候选文本;将该候选文本输入文本处理模型,得到文本处理结果信息;若该候选文本对应的文本处理结果信息满足预设条件,将该候选文本以及该候选文本对应的文本处理结果信息确定为对抗样本。该实施方式实现了控制对抗样本向着期望的方向生成。

Methods, devices, electronic devices and computer-readable media for counter sample generation

【技术实现步骤摘要】
对抗样本生成方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
,具体涉及对抗样本生成方法、装置、电子设备和计算机可读介质。
技术介绍
随着人工智能的发展,相关技术已广泛应用于各个领域。例如,图像识别、语音识别、自然语言处理等领域,人工智能技术均发挥了举足轻重的作用。人工智能技术的应用,使得人与机器的交互更加便利。与此同时,由于各种功能的实现有赖于通过大量的样本的训练。训练后的神经网络对于干扰比较敏感,可能影响神经网络的安全性。为了提高神经网络的抗干扰性,需要基于对抗样本对神经网络进行训练。因而对于生成对抗样本提出了需求。
技术实现思路

技术实现思路
部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了对抗样本生成方法、装置、电子设备和计算机可读介质。第一方面,本公开的一些实施例提供了一种对抗样本生成方法,包括:对于训练样本集中的训练样本,执行以下生成步骤,其中,训练样本包括样本文本和该样本文本对应的标注信息本文档来自技高网...

【技术保护点】
1.一种对抗样本生成方法,包括:对于训练样本集中的训练样本,执行以下生成步骤,其中,训练样本包括样本文本和该样本文本对应的标注信息:生成该样本文本对应的候选文本;将该候选文本输入文本处理模型,得到文本处理结果信息;若该候选文本对应的文本处理结果信息满足预设条件,将该候选文本以及该候选文本对应的文本处理结果信息确定为对抗样本。

【技术特征摘要】
1.一种对抗样本生成方法,包括:对于训练样本集中的训练样本,执行以下生成步骤,其中,训练样本包括样本文本和该样本文本对应的标注信息:生成该样本文本对应的候选文本;将该候选文本输入文本处理模型,得到文本处理结果信息;若该候选文本对应的文本处理结果信息满足预设条件,将该候选文本以及该候选文本对应的文本处理结果信息确定为对抗样本。2.根据权利要求1所述的方法,其中,所述生成该样本文本对应的候选文本,包括:基于马尔科夫链蒙特卡罗MCMC采样方法以及语言模型LM生成该样本文本对应的候选文本。3.根据权利要求1所述的方法,其中,所述方法还包括:若该候选文本对应的文本处理结果信息不满足预设条件,将该样本文本对应的候选文本作为样本文本,继续执行所述生成步骤。4.根据权利要求1所述的方法,其中,所述方法还包括:将生成的对抗样本与所述训练样本集的合集确定为新的训练样本集;基于所述新的训练样本集对所述文本处理模型进行训练。5.根据权利要求2所述的方法,其中,所述基于马尔科夫链蒙特卡罗MCMC采样方法以及语言模型LM生成该样本文本对应的候选文本,包括:对该样本文本进行删词,或从目标词库中选取至少一个词加入该样本文本;或从目标词库中选取词替换该样本文本中的词,得到该样本文本对应的候选文本。6.根据权利要求5所述的方法,其中,所述目标词库通过以下步骤得到:对于该样本文本中的词,基于所述LM对初始词库进行筛选,得到所述目标词库。7.一种对抗样本生成装置,包括:执行单元,被配置成对于训练样本集中的训练样本,利用所包括的子单元进行对抗样本的生成,其中,训练样本包括样本文本和该样本文本对应的标注信息,所述执行单元包括以下子单元:生成子单元,被配置成...

【专利技术属性】
技术研发人员:苗宁周浩李磊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1