对抗样本生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23983747 阅读：28 留言：0更新日期：2020-04-29 12:32

本申请公开了对抗样本生成方法、装置、电子设备及存储介质，涉及深度学习领域，其中方法可包括：获取包括文本段落、问题以及答案的三元组，所述问题为针对文本段落提出的问题，所述答案为基于文本段落生成的答案；对所述问题中的预定类型的词进行替换，得到至少一个修改后的问题；确定出所述问题对应的至少一个虚假答案，虚假答案与答案属于相同类型；根据修改后的问题及虚假答案生成至少一个干扰句；按照每次修改在文本段落中插入一个干扰句的方式，得到至少一个修改后的文本段落，选定一个修改后的文本段落作为对抗样本。应用本申请所述方案，可生成能够有效攻击模型的对抗样本，并可提升模型性能等。

Generation method, device, electronic equipment and storage medium of countermeasure samples

全部详细技术资料下载

【技术实现步骤摘要】
对抗样本生成方法、装置、电子设备及存储介质
本申请涉及计算机应用技术，特别涉及深度学习领域的对抗样本生成方法、装置、电子设备及存储介质。
技术介绍
阅读理解是自然语言处理(NLP，NaturalLanguageProcessing)领域的经典任务，即给定一个文本段落，针对该文本段落提出一个问题，答案可为该文本段落中的一个文本片段等。在实际应用中，可利用训练得到的阅读理解模型来实现机器阅读理解，目前表现较好的阅读理解模型包括双向注意力流模型(BiDAF，Bi-DirectionalAttentionFlow)等。阅读理解模型容易受到对抗样本的干扰，从而导致推理出错误答案。因此，需要生成/构建对抗样本对阅读理解模型进行优化，以提升模型性能等。针对阅读理解模型，目前通常采用黑盒攻击中的串联攻击方式，在黑盒攻击中，攻击者只能使用提供的输入查询目标模型，并获得输出预测和置信度得分，不具有完全访问权。串联攻击方式中，在文本段落中添加分散注意力的干扰句来生成对抗样本，但被添加的干扰句通常只是基于简单的语法规则或句式模板等生成的，实际效果并不理想。
技术实现思路
有鉴于此，本申请提供了对抗样本生成方法、装置、电子设备及存储介质。一种对抗样本生成方法，包括：获取包括文本段落、问题以及答案的三元组，所述问题为针对所述文本段落提出的问题，所述答案为基于所述文本段落生成的答案；对所述问题中的预定类型的词进行替换，得到至少一个修改后的问题；确定出所述问题对应的至少一个...

【技术保护点】
1.一种对抗样本生成方法，其特征在于，包括：/n获取包括文本段落、问题以及答案的三元组，所述问题为针对所述文本段落提出的问题，所述答案为基于所述文本段落生成的答案；/n对所述问题中的预定类型的词进行替换，得到至少一个修改后的问题；/n确定出所述问题对应的至少一个虚假答案，所述虚假答案与所述答案属于相同类型；/n根据所述修改后的问题及所述虚假答案生成至少一个干扰句；/n按照每次修改在所述文本段落中插入一个干扰句的方式，得到至少一个修改后的文本段落，选定一个修改后的文本段落作为所述对抗样本。/n

【技术特征摘要】
1.一种对抗样本生成方法，其特征在于，包括：
获取包括文本段落、问题以及答案的三元组，所述问题为针对所述文本段落提出的问题，所述答案为基于所述文本段落生成的答案；
对所述问题中的预定类型的词进行替换，得到至少一个修改后的问题；
确定出所述问题对应的至少一个虚假答案，所述虚假答案与所述答案属于相同类型；
根据所述修改后的问题及所述虚假答案生成至少一个干扰句；
按照每次修改在所述文本段落中插入一个干扰句的方式，得到至少一个修改后的文本段落，选定一个修改后的文本段落作为所述对抗样本。

2.根据权利要求1所述的方法，其特征在于，
所述预定类型的词包括以下之一或任意组合：名词、形容词、命名实体、数字。

3.根据权利要求1所述的方法，其特征在于，
所述确定出所述问题对应的至少一个虚假答案包括：
确定所述答案所属的类型；
从斯坦福问答数据集中与所述答案属于相同类型的各答案中随机选出至少一个，作为所述虚假答案。

4.根据权利要求3所述的方法，其特征在于，
该方法进一步包括：获取所定义的至少两种不同类型；分别确定出所述斯坦福问答数据集中的各答案所属的类型。

5.根据权利要求1所述的方法，其特征在于，
所述根据所述修改后的问题及所述虚假答案生成至少一个干扰句包括：
确定对应的语法规则；
根据所述语法规则将任一修改后的问题与任一虚假答案进行组合，得到至少一个干扰句。

6.根据权利要求1所述的方法，其特征在于，
该方法进一步包括：对生成的干扰句进行语法检查，过滤掉语法不正确的干扰句。

7.根据权利要求1所述的方法，其特征在于，
所述按照每次修改在所述文本段落中插入一个干扰句的方式，得到至少一个修改后的文本段落包括：
针对任一干扰句，分别将所述干扰句随机插入到所述文本段落中的至少一个位置，得到至少一个修改后的文本段落。

8.根据权利要求1所述的方法，其特征在于，
所述选定一个修改后的文本段落作为所述对抗样本包括：分别将各修改后的文本段落输入预先获取的阅读理解模型，根据所述阅读理解模型的输出确定出最具攻击性的修改后的文本段落，作为所述对抗样本。

9.根据权利要求1所述的方法，其特征在于，
该方法进一步包括：利用所述对抗样本对预先获取的阅读理解模型进行优化。

10.一种对抗样本生成装置，其特征在于，包括：信息获取单元以及样本生成单元；
所述信息获取单元，用于获取包括文本段落、问题以及答案的三元组，所述问题为针对所述文本...

【专利技术属性】
技术研发人员：王文华，吕中厚，刘焱，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人