归因解释方法的稳定性的确定方法、装置和设备制造方法及图纸

技术编号:35826634 阅读:10 留言:0更新日期:2022-12-03 13:54
本发明专利技术实施例提供一种归因解释方法的稳定性的确定方法、装置和设备,该方法包括:获取样本文本;对样本文本进行文本对抗攻击,得到攻击后的样本文本;分别对样本文本和攻击后的样本文本采用多个归因解释方法进行解释,得到样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值;基于样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值,确定各个归因解释方法对应的归因值排序发生变化的单词数量;根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性。本发明专利技术实施例的方法为归因解释方法的衡量和选择提供了合理准确的评价标准,实现了对各个归因解释方法优劣的准确衡量。对各个归因解释方法优劣的准确衡量。对各个归因解释方法优劣的准确衡量。

【技术实现步骤摘要】
归因解释方法的稳定性的确定方法、装置和设备


[0001]本专利技术涉及计算机
,尤其涉及一种归因解释方法的稳定性的确定方法、装置和设备。

技术介绍

[0002]归因解释方法可以给出输入当中每个特征对模型的对应的贡献大小,可以在一定程度上解释模型的推理过程,因此在近年来得到了很多的关注。
[0003]相关技术中,存在多种不同的归因解释方法,但不同的归因解释方法对于同一个模型同一个样例会产生完全不同的解释结果。因此,如何有效的确定各种归因解释方法的优劣,是本领域技术人员亟需关注的问题。

技术实现思路

[0004]针对现有技术中的问题,本专利技术实施例提供一种归因解释方法的稳定性的确定方法、装置和设备。
[0005]具体地,本专利技术实施例提供了以下技术方案:
[0006]第一方面,本专利技术实施例提供了一种归因解释方法的稳定性的确定方法,包括:
[0007]获取样本文本;
[0008]对所述样本文本进行文本对抗攻击,得到攻击后的样本文本;
[0009]分别对样本文本和所述攻击后的样本文本采用多个归因解释方法进行解释,得到样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值;
[0010]基于所述样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值,确定各个归因解释方法对应的归因值排序发生变化的单词数量;
[0011]根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性。
[0012]进一步地,所述对所述样本文本进行文本对抗攻击,得到攻击后的样本文本,包括:
[0013]确定样本文本中的各个单词的攻击顺序及各个单词对应的同义词集合;
[0014]根据所述攻击顺序和各个单词对应的同义词集合,对样本文本进行攻击,得到攻击后的样本文本。
[0015]进一步地,所述根据所述攻击顺序和各个单词对应的同义词集合,对样本文本进行攻击,得到攻击后的样本文本各个单词,包括:
[0016]对各个单词对应的同义词集合中的各个同义词进行打分,得到各个同义词的打分结果;
[0017]根据所述攻击顺序和各个单词对应的所述同义词的打分结果,对样本文本进行攻击。
[0018]进一步地,所述对各个单词对应的同义词集合中的各个同义词进行打分,得到各个同义词的打分结果,包括:
[0019]根据样本文本中的各个单词的同义词,对样本文本中的单词进行替换,得到各个目标文本;所述目标文本包括所述所述同义词;
[0020]分别对样本文本和所述目标文本采用归因解释方法进行解释,得到样本文本中各个单词的归因值以及目标文本中各个单词的归因值;
[0021]根据所述样本文本中各个单词的归因值及各个目标文本中各个单词的归因值,确定各个同义词对应的各个目标文本中归因值排序发生变化的单词数量;
[0022]根据各个目标文本中归因值排序发生变化的单词数量,对各个同义词进行打分,得到各个同义词的打分结果。
[0023]进一步地,所述根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性,包括:
[0024]根据归因值排序发生变化的单词数量和预设的攻击成功条件,确定各个归因解释方法的攻击成功率;
[0025]根据各个归因解释方法的攻击成功率,确定各个归因解释方法的稳定性。
[0026]进一步地,所述根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性,包括:
[0027]所述根据归因值排序发生变化的单词数量,确定各个归因解释方法的解释相似度;
[0028]根据各个归因解释方法的解释相似度,确定各个归因解释方法的稳定性。
[0029]第二方面,本专利技术实施例还提供了一种归因解释方法的稳定性的确定装置,包括:
[0030]获取模块,用于获取样本文本;
[0031]处理模块,用于对所述样本文本进行文本对抗攻击,得到攻击后的样本文本;
[0032]分别对样本文本和所述攻击后的样本文本采用多个归因解释方法进行解释,得到样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值;
[0033]基于所述样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值,确定各个归因解释方法对应的归因值排序发生变化的单词数量;
[0034]确定模块,用于根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性。
[0035]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述归因解释方法的稳定性的确定方法。
[0036]第四方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述归因解释方法的稳定性的确定方法。
[0037]第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述归因解释方法的稳定性的确定方法。
[0038]本专利技术实施例提供的归因解释方法的稳定性的确定方法、装置和设备,基于攻击后的样本文本中归因值排序发生变化的单词数量确定各个归因解释方法的稳定性,即基于攻击前后的样本文本中归因值排序的相似度来确定各个归因解释方法的稳定性,从各个归因解释方法的稳定性维度出发,为归因解释方法的衡量和选择提供了合理准确的评价标准
和评价结果,实现了对各个归因解释方法优劣的准确衡量。
附图说明
[0039]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1是本专利技术实施例提供的归因解释方法的稳定性的确定方法的流程示意图;
[0041]图2是本专利技术实施例提供的归因解释方法的稳定性的确定方法中的同义词集合示意图;
[0042]图3是本专利技术实施例提供的各个归因解释方法的稳定性示意图之一;
[0043]图4是本专利技术实施例提供的各个归因解释方法的稳定性示意图之二;
[0044]图5是本专利技术实施例提供的各个归因解释方法的稳定性示意图之三;
[0045]图6是本专利技术实施例提供的各个归因解释方法的稳定性示意图之四;
[0046]图7是本专利技术实施例提供的各个归因解释方法的稳定性示意图之五;
[0047]图8是本专利技术实施例提供的另一归因解释方法的稳定性的确定方法的流程示意图;
[0048]图9是本专利技术实施例提供的归因解释方法的稳定性的确定装置的结构示意图;
[0049]图10是本专利技术实施例提供的电子设备的结构示意图。
具体实施方式
[0050]为使本专利技术的目的、技术方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种归因解释方法的稳定性的确定方法,其特征在于,包括:获取样本文本;对所述样本文本进行文本对抗攻击,得到攻击后的样本文本;分别对样本文本和所述攻击后的样本文本采用多个归因解释方法进行解释,得到样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值;基于所述样本文本中各个单词的归因值以及攻击后的样本文本中各个单词的归因值,确定各个归因解释方法对应的归因值排序发生变化的单词数量;根据归因值排序发生变化的单词数量,确定各个归因解释方法的稳定性。2.根据权利要求1所述的归因解释方法的稳定性的确定方法,其特征在于,所述对所述样本文本进行文本对抗攻击,得到攻击后的样本文本,包括:确定样本文本中的各个单词的攻击顺序及各个单词对应的同义词集合;根据所述攻击顺序和各个单词对应的同义词集合,对样本文本进行攻击,得到攻击后的样本文本。3.根据权利要求1所述的归因解释方法的稳定性的确定方法,其特征在于,所述根据所述攻击顺序和各个单词对应的同义词集合,对样本文本进行攻击,得到攻击后的样本文本各个单词,包括:对各个单词对应的同义词集合中的各个同义词进行打分,得到各个同义词的打分结果;根据所述攻击顺序和各个单词对应的所述同义词的打分结果,对样本文本进行攻击。4.根据权利要求3所述的归因解释方法的稳定性的确定方法,其特征在于,所述对各个单词对应的同义词集合中的各个同义词进行打分,得到各个同义词的打分结果,包括:根据样本文本中的各个单词的同义词,对样本文本中的单词进行替换,得到各个目标文本;所述目标文本包括所述所述同义词;分别对样本文本和所述目标文本采用归因解释方法进行解释,得到样本文本中各个单词的归因值以及目标文本中各个单词的归因值;根据所述样本文本中各个单词的归因值及各个目标文本中各个单词的归因值,确定各个同义词对应的各个目标文本中归因值排序发生变化的单词数量;根据各个目标文本中归因值排序发生变化的单词数量,对各个同义词...

【专利技术属性】
技术研发人员:张元哲刘康赵军杨朝
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1