【技术实现步骤摘要】
本专利技术涉及一种基于ofs对抗文本流畅性评估方法,属于对抗文本流畅性评估。
技术介绍
1、大语言模型(large language model,llm)在生产和生活中的应用日益广泛。与传统的深度学习模型不同,llm的参数往往能够达到十亿的数量级。海量的参数使得llm相比于传统深度学习模型具有更强的自然语言处理(natural language processing,nlp)能力,能够完成更多种类、更高难度、更加多元的任务。chatgpt作为llm发展过程中的里程碑式的模型,其在多种nlp任务中都达到了最先进的水平。
2、然而,各种主流的深度神经网络(deep neural network,dnn)在受到对抗攻击时都会显露出不同程度的脆弱性。受到对抗攻击的深度学习模型被称为目标模型。逃逸攻击是一种最常见的对抗攻击方式,其作用于目标模型训练后的测试阶段,敌手往往通过构造对抗样本(adversarial example,ae)来实现逃逸攻击。ae是一种向原始良性样本中添加人类难以察觉的微小扰动后得到的恶意样本,其能够触发深度学习
...【技术保护点】
1.一种基于OFS对抗文本流畅性评估方法,其特征在于,生成对抗文本,并使用对抗文本攻击目标模型,利用OFS计算对抗文本流畅性分数,评估对抗文本流畅性。
2.根据权利要求1所述的一种基于OFS对抗文本流畅性评估方法,其特征在于,对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。
3.根据权利要求2所述的一种基于OFS对抗文本流畅性评估方法,其特征在于,排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。
4.根据权利要求3所述的一种基于OFS对抗文本流畅性评估方
...【技术特征摘要】
1.一种基于ofs对抗文本流畅性评估方法,其特征在于,生成对抗文本,并使用对抗文本攻击目标模型,利用ofs计算对抗文本流畅性分数,评估对抗文本流畅性。
2.根据权利要求1所述的一种基于ofs对抗文本流畅性评估方法,其特征在于,对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。
3.根据权利要求2所述的一种基于ofs对抗文本流畅性评估方法,其特征在于,排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。
4.根据权利要求3所述的一种基于ofs对抗文本流畅性评估方法,其特征在于,为文本中每个词语的重要性打分的方法是:利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;挑选重要性分数大于0的所有词语,并按重要性分数大小由高到低对词语进行排序。
5.根据权利要求4所述的一种基于ofs对抗文本流畅性评估方法,其特征在于,为...
【专利技术属性】
技术研发人员:叶麟,张云婷,张宏莉,李柏松,肖新光,武跃,朱若彬,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。