一种基于一阶泰勒分解的图像分类模型可解释性方法技术

技术编号:36693681 阅读:21 留言:0更新日期:2023-02-27 20:03
本发明专利技术涉及一种基于一阶泰勒分解的图像分类模型可解释性方法,包括缩减图片像素值,通过图像Transformer模型将图像分块为N*N个token,并对图像进行预测,输出全部类别的置信度,选择需要解释的类别,对其置信度进行反向传播,计算加权的注意力响应,获取最后一个Transformer层中注意力矩阵的数值及其对应的梯度值,将两者相乘,将获得的乘积取正值,获得可解释性矩阵,取可解释性矩阵中的第一行,从第二个元素开始到最后一个元素,重新排列成输入图像的尺寸N*N,将图像归一化后获得可解释性的热力图。与现有技术相比,本发明专利技术具有快速准确、实现简单、鲁棒性好等优点。鲁棒性好等优点。鲁棒性好等优点。

【技术实现步骤摘要】
一种基于一阶泰勒分解的图像分类模型可解释性方法


[0001]本专利技术涉及图像处理
,具体涉及一种基于一阶泰勒分解的图像分类模型可解释性方法。

技术介绍

[0002]模型可解释性方法是指通过对网络模型预测的解释,使得人们可以理解网络模型输出的依据。理解网络的预测输出标准,对于很多关键领域的模型至关重要,例如运输,医疗,法律,财经等,因为可解释性有助于使用者信任模型,知道在何种情况下使用模型是安全可靠的,并且可以在模型发生预测错误时了解错误原因和优化模型的方向。
[0003]模型可解释性方法最初广泛应用于对CNN输出的解释,常用的方法包括CAM和Grad

CAM。CAM是利用特征图上每个位置的值的激活程度,通过线性组合获得激活图,最后使用上采样,将激活图还原到与原图一样的大小,通过叠加,获得对于输出的解释。CAM虽然方法简单,但是它要求模型最后一层使用全局平均池化操作,导致其他模型的结构需要修改,并重新训练,大大限制了它的使用场景。Grad

CAM解决了这一问题,其基本思路与CAM一致,通过对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:包括:S1:缩减图片像素值,通过图像Transformer模型将图像分块为N*N个token,并对图像进行预测,输出全部类别的置信度,S2:选择需要解释的类别,对其置信度进行反向传播,S3:计算加权的注意力响应,获取最后一个Transformer层中注意力矩阵的数值及其对应的梯度值,将两者相乘,S4:将S3中获得的乘积取正值,获得可解释性矩阵,S5:取可解释性矩阵中的第一行,从第二个元素开始到最后一个元素,重新排列成输入图像的尺寸N*N,S6:将图像归一化后获得可解释性的热力图。2.根据权利要求1所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S1中,输入图像的数值压缩,使一阶泰勒分解后的近似模型与原模型的差异减小:p
c
=F(X)p

c
=F(αX)|p
c

p

c
|<ε,其中,p
c
为压缩前的图像之于类别c的分类置信度,p

c
为压缩前的图像之于类别c的分类置信度,F为图像Transformer模型,X为输入图像,α为像素值压缩系数,p

c
与p
c
的差别控制在尽量小的范围内,即ε。3.根据权利要求1或2所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S1中,像素值压缩系数为α=0.1~0.5。4.根据权利要求1所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S2中,对其置信度p
c
进行反向传播的计算式为:其中,p
c
为分类c的置信度,x为输入图像,A1,

,A
n

【专利技术属性】
技术研发人员:邓若愚胡尚薇
申请(专利权)人:同济人工智能研究院苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1