【技术实现步骤摘要】
一种基于一阶泰勒分解的图像分类模型可解释性方法
[0001]本专利技术涉及图像处理
,具体涉及一种基于一阶泰勒分解的图像分类模型可解释性方法。
技术介绍
[0002]模型可解释性方法是指通过对网络模型预测的解释,使得人们可以理解网络模型输出的依据。理解网络的预测输出标准,对于很多关键领域的模型至关重要,例如运输,医疗,法律,财经等,因为可解释性有助于使用者信任模型,知道在何种情况下使用模型是安全可靠的,并且可以在模型发生预测错误时了解错误原因和优化模型的方向。
[0003]模型可解释性方法最初广泛应用于对CNN输出的解释,常用的方法包括CAM和Grad
‑
CAM。CAM是利用特征图上每个位置的值的激活程度,通过线性组合获得激活图,最后使用上采样,将激活图还原到与原图一样的大小,通过叠加,获得对于输出的解释。CAM虽然方法简单,但是它要求模型最后一层使用全局平均池化操作,导致其他模型的结构需要修改,并重新训练,大大限制了它的使用场景。Grad
‑
CAM解决了这一问题,其基本思路 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:包括:S1:缩减图片像素值,通过图像Transformer模型将图像分块为N*N个token,并对图像进行预测,输出全部类别的置信度,S2:选择需要解释的类别,对其置信度进行反向传播,S3:计算加权的注意力响应,获取最后一个Transformer层中注意力矩阵的数值及其对应的梯度值,将两者相乘,S4:将S3中获得的乘积取正值,获得可解释性矩阵,S5:取可解释性矩阵中的第一行,从第二个元素开始到最后一个元素,重新排列成输入图像的尺寸N*N,S6:将图像归一化后获得可解释性的热力图。2.根据权利要求1所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S1中,输入图像的数值压缩,使一阶泰勒分解后的近似模型与原模型的差异减小:p
c
=F(X)p
’
c
=F(αX)|p
c
‑
p
’
c
|<ε,其中,p
c
为压缩前的图像之于类别c的分类置信度,p
’
c
为压缩前的图像之于类别c的分类置信度,F为图像Transformer模型,X为输入图像,α为像素值压缩系数,p
’
c
与p
c
的差别控制在尽量小的范围内,即ε。3.根据权利要求1或2所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S1中,像素值压缩系数为α=0.1~0.5。4.根据权利要求1所述的基于一阶泰勒分解的图像分类模型可解释性方法,其特征在于:在S2中,对其置信度p
c
进行反向传播的计算式为:其中,p
c
为分类c的置信度,x为输入图像,A1,
…
,A
n
技术研发人员:邓若愚,胡尚薇,
申请(专利权)人:同济人工智能研究院苏州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。