文本分类模型鲁棒性检测方法技术

技术编号：42496121 阅读：22 留言：0更新日期：2024-08-22 14:06

本发明专利技术公开了文本分类模型鲁棒性检测方法，包括：将原始样本中的目标单词随机替换为同义词，获得第一样本；通过T轮迭代逐步优化所述第一样本与所述原始样本间的语义相似度，获得测试样本；利用由若干测试样本构建的测试样本集对目标文本分类模型进行鲁棒性测试，根据鲁棒性测试结果调整所述目标文本分类模型的训练过程和/或参数配置。本发明专利技术通过生成与原始样本在语义上接近但在表达上略有差异的对抗样本，并通过多轮迭代优化这些样本，有效地模拟了真实世界中可能遇到的各种文本变化，从而能够更全面的检测文本分类模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及神经网络，尤其涉及文本分类模型鲁棒性检测方法。

技术介绍

1、随着信息技术和人工智能的快速发展，文本分类模型在许多领域中发挥着重要作用，例如情感分析、垃圾邮件检测、以及自动新闻分类等。这些模型通常基于机器学习技术，尤其是深度学习，对大量文本数据进行处理和分类。

2、然而，尽管文本分类模型在多个应用场景中展现了高效的分类能力，它们在面对恶意的输入扰动时往往表现出脆弱性。这种脆弱性可能导致模型在实际应用中的性能大幅下降，尤其是在面对经过精心设计的对抗性文本样本时。对抗性样本是指那些经过特殊加工，能够误导模型做出错误判断的数据样本。因此，提高文本分类模型的鲁棒性，使其能够抵抗这类对抗性攻击，成为当前研究的一个重要方向。

3、传统的模型鲁棒性增强方法主要集中在图像领域，而针对文本数据的研究相对较少。此外，现有的文本模型鲁棒性测试方法通常依赖于白盒攻击，即攻击者需要知道模型的内部结构和参数。这一要求限制了这些方法在实际应用中的广泛性和实用性，因为在很多实际情况下，攻击者并不可能完全了解目标模型的内部信息。p>

本文档来自技高网...

【技术保护点】

1.文本分类模型鲁棒性检测方法，其特征在于，包括步骤：

2.如权利要求1所述的文本分类模型鲁棒性检测方法，其特征在于，所述在词嵌入空间中搜索与所述第一样本距离相近的样本作为第二样本的方法包括：

3.如权利要求1所述的文本分类模型鲁棒性检测方法，其特征在于，所述使用训练好的词嵌入模型为目标单词在嵌入空间内找到至少一个距离相近的同义词的方法包括：

4.如权利要求1所述的文本分类模型鲁棒性检测方法，其特征在于，所述对第二样本进行基于回溯控制的扰动优化获得第三样本的方法包括：

5.如权利要求4所述的文本分类模型鲁棒性检测方法，其特征在于，所述基于回...

【技术特征摘要】

1.文本分类模型鲁棒性检测方法，其特征在于，包括步骤：

2.如权利要求1所述的文本分类模型鲁棒性检测方法，其特征在于，所述在词嵌入空间中搜索与所述第一样本距离相近的样本作为第二样本的方法包括：

4...

【专利技术属性】
技术研发人员：李元媛，刘钊荣，熊熙，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人