一种针对同义词替换攻击的防御方法技术

技术编号：36705301 阅读：32 留言：0更新日期：2023-03-01 09:26

本发明专利技术涉及一种针对同义词替换攻击的防御方法，包括将新闻文本嵌入向量表示得到新闻文本的句子向量序列；提取新闻文本中每个句子的关键词生成候选关键词集；将每个候选关键词的词向量和glove训练词向量进行余弦相似度计算得到候选关键词的同义词；对候选关键词的同义词进行语法检查；将与关键词候选关键词词性相同的同义词作为最终候选词，用最终候选词对新闻文本中相应的关键词进行替换得到第二新闻文本；将第二新闻文本嵌入向量表示得到第一新闻文本向量；将新闻文本的句子向量序列输入LSTM计算得到第二新闻文本向量；将与第二新闻文本向量的余弦相似度超过设定阈值的第一新闻文本向量映射为文本并作为新闻文本的对抗样本。样本。样本。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对同义词替换攻击的防御方法

[0001]本专利技术属于计算机
，具体涉及一种针对同义词替换攻击的防御方法。

技术介绍

[0002]随着大数据时代的到来和人工智能技术的飞速发展，深度学习在计算机图像处理、信号分析和自然语言处理等领域中都得到了广泛应用。在自然语言处理领域，文本处理技术在阅读理解、情感分析、文本分类、语音识别等领域取得了突破性进展。
[0003]同时深度学习模型也面临着各种安全问题，而新闻文本作为一种公共影响力较大的宣传文本，其安全问题由为重要，其中，对抗攻击是一个热点问题。在自然语言处理领域，对抗攻击指在原始文本上添加微小的扰动得到对抗文本，通过输入对抗文本使深度学习模型输出一个错误语义标签，而用户却不能察觉对抗文本相较于原始文本在语义上的改动。为解决这一安全问题，需要使用对抗文本对目标模型进行防御对抗攻击的训练，以使目标模型可以有效抵御外界的对抗攻击。
[0004]对抗性训练的根本目的是利用生成的对抗样本来增强深度学习模型的鲁棒性，从而防御文本攻击对模型的恶意干扰。
[00...

【技术保护点】

【技术特征摘要】
1.一种针对同义词替换攻击的防御方法，其特征在于，包括：S1：获取具有标签信息的新闻文本数据；所述标签信息为新闻的类别；S2：利用Counter
‑
fitting将新闻文本中的词嵌入向量表示得到新闻文本中每个句子的隐向量并生成新闻文本的句子向量序列；S3：利用TextRank算法提取新闻文本中每个句子的关键词生成候选关键词集；S4：分别将候选关键词集中每个关键词的词向量和glove训练词向量进行余弦相似度计算，将余弦相似度大于设定阈值的M个glove训练词向量对应的词作为该关键词的候选同义词；S5：对关键词的候选同义词进行语法检查；将与关键词词性相同的候选同义词作为关键词的最终候选词，并用最终候选词对新闻文本中相应的关键词进行替换得到第二新闻文本；将第二新闻文本嵌入向量表示得到第一新闻文本向量；S6：将新闻文本的句子向量序列输入LSTM计算得到包含上下文信息的第二新闻文本向量；S7：根据第一新闻文本向量和第二新闻文本向量的余弦相似度，将余弦相似度超过设定阈值的第一新闻文本向量映射为文本并作为新闻文本的对抗样本；S8：将新闻文本的对抗样本和新闻文本作为训练样本对目标模型进行训练，并根据新闻文本的标签信息创建目标...

【专利技术属性】
技术研发人员：刘红，陆孝晶，肖云鹏，王国胤，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人