一种基于神经网络可解释性的文本分类方法技术

技术编号：24331212 阅读：77 留言：0更新日期：2020-05-29 19:40

本发明专利技术涉及一种基于神经网络可解释性的文本分类方法，该方法利用训练完成的文本分类模型，对输入的文本信息进行分类，所述的文本分类模型的训练步骤包括：S1)获取训练数据，训练得到待增强的文本分类模型；S2)通过神经网络解释方法对训练数据中的词语进行排序；S3)按照排序顺序，依次对各词语添加扰动；S4)在最小化扰动的约束条件下生成对抗样本，并获取对抗样本的生成成功率；S5)判断生成成功率是否低于设定阈值，若是，则完成训练并输出该文本分类模型，若否，则执行步骤S6)；S6)将对抗样本加入当前训练数据作为新的训练数据，并返回执行步骤S1)，与现有技术相比，本发明专利技术具有鲁棒性高等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络可解释性的文本分类方法
本专利技术涉及深度学习技术的自然语言处理领域，尤其是涉及一种基于神经网络可解释性的文本分类方法。
技术介绍
文本分类是指根据预定义的分类体系或分类标准将未标记的文本分类至其中的某一个或几个类别中。早期的分类技术主要包括基于规则模版的方法与基于机器学习的方法，近年来，随着深度学习的快速发展，基于神经网络的文本分类模型，例如FastText、TextCNN、BERT等，已经成为解决该类问题的主流方法。随着文本分类模型被广泛部署于各种实际应用，模型的鲁棒性也开始受到越来越多的关注。由于神经网络复杂的内部运算机制以及训练数据的分布上存在的天然偏置，如果在原输入样本中添加细微的、难以分辨的扰动，生成的样本可能诱导模型产生完全不同的预测结果，这个过程被称为对抗攻击(AdversarialAttack)，这些扰动后的样本被称为对抗样本(AdversarialExamples)。对抗样本的存在对模型的安全性产生了巨大威胁。尽管已经有一些研究者开始关注文本分类模型的对抗样本，然而，当前研究尚未深入结合神经网络的可解释性问题。可解释性是指用人类可理解的方式直观展示模型的决策过程，从而深刻揭示输入变量与预测结果之间的联系，为模型调优、错误发现、预测结果的解释等提供依据。中国专利CN201910729584.9公开了一种基于可解释性对抗文本的对抗训练方法，但是其只适用于RNN模型，没有利用神经网络解释方法，其可解释性只在于生成的样本扰动方向合理，同时在添加扰动和对抗训练过程中，均采用单...

【技术保护点】
1.一种基于神经网络可解释性的文本分类方法，其特征在于，该方法利用训练完成的文本分类模型，对输入的文本信息进行分类，所述的文本分类模型的训练步骤包括：/nS1)获取训练数据，训练得到待增强的文本分类模型；/nS2)通过神经网络解释方法对训练数据中的词语进行排序；/nS3)按照排序顺序，依次对各词语添加扰动；/nS4)在最小化扰动的约束条件下生成对抗样本，并获取对抗样本的生成成功率；/nS5)判断生成成功率是否低于设定阈值，若是，则完成训练并输出该文本分类模型，若否，则执行步骤S6)；/nS6)将对抗样本加入当前训练数据作为新的训练数据，并返回执行步骤S1)。/n

【技术特征摘要】
1.一种基于神经网络可解释性的文本分类方法，其特征在于，该方法利用训练完成的文本分类模型，对输入的文本信息进行分类，所述的文本分类模型的训练步骤包括：
S1)获取训练数据，训练得到待增强的文本分类模型；
S2)通过神经网络解释方法对训练数据中的词语进行排序；
S3)按照排序顺序，依次对各词语添加扰动；
S4)在最小化扰动的约束条件下生成对抗样本，并获取对抗样本的生成成功率；
S5)判断生成成功率是否低于设定阈值，若是，则完成训练并输出该文本分类模型，若否，则执行步骤S6)；
S6)将对抗样本加入当前训练数据作为新的训练数据，并返回执行步骤S1)。

2.根据权利要求1所述的一种基于神经网络可解释性的文本分类方法，其特征在于，所述的步骤S2)中，神经网络解释方法对词语按照对模型当前预测结果的影响程度进行定量描述，并按照逆序排序。

3.根据权利要求2所述的一种基于神经网络可解释性的文本分类方法，其特征在于，所述的神经网络解释方法包括敏感度分析、基于一阶泰勒展开的显著性分析、留一法和层级间相关性传播。

4.根据权利要求1所述的一种基于神经网络可解释性的文本分类方法，其特征在于，所述的步骤S3)中，对词语添加扰动的方法包括词语级别的扰动方法和/或字符级别的扰动方法。

5.根据权利要求4所述的一种基于神经网络可解释性的文本分类方法，其特征在于，所述的词语级别的扰动方法包括以下步骤：
S301)获取输入词语；
...

【专利技术属性】
技术研发人员：杜庆峰，徐锦程，倪奕玮，孙清志，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人