一种基于专家交互学习的深度判别模型的解释结果修正方法技术

技术编号:37846772 阅读:14 留言:0更新日期:2023-06-14 22:32
本发明专利技术属于可解释技术领域,具体涉及一种基于专家交互学习的深度判别模型的解释结果修正方法,包括:获取图像,并将图像分成预测训练集、解释训练集;通过预测训练集对resnet18网络模型进行训练,并加入修正模块,得到解释判别模型;将解释训练集中的图像输入解释判别模型,得到每个像素对模型决策的重要程度的可解释热力图;通过专家知识对可解释热力图进行交互,得到判别结果;将错误解释输入解释判别模型的修正模块进行错误解释结果修正;对修正后的解释结果进行评估。本发明专利技术本发明专利技术通过使用主动学习的训练策略、专家知识交互以及对网络模型可解释结果的修正,提高了网络模型的可解释能力,提高了用户对于网络模型的信任程度。提高了用户对于网络模型的信任程度。提高了用户对于网络模型的信任程度。

【技术实现步骤摘要】
一种基于专家交互学习的深度判别模型的解释结果修正方法


[0001]本专利技术属于可解释
,具体涉及一种基于专家交互学习的深度判别模型的解释结果修正方法。

技术介绍

[0002]随着科技的迅速发展以及生活质量的不断提升,由深度神经网络(Deep Neural Networks,DNN)驱动的人工智能(Artificial Intelligence,AI)在整个人类社会中无处不在。然而,当使用时,尤其是需要进行医疗诊断以及重要决策时,AI决策模型不能够只提供“建议”,而是需要提供与“建议”以及与之对应的逻辑过程,否则AI决策模型不能得到使用它的用户的“信任”。
[0003]目前大多数的可解释技术是通过基于梯度的可视化方法、使用白盒模型来解释黑盒模型的模型蒸馏方法,以及认为模型在提供决策时同时需要提供决策依据的内在方法的可解释技术,这些可解释方法使得用户能够在一定程度上理解模型决策的依据。
[0004]然而,这些可解释方法忽视了用户的先验知识在训练过程中的作用,当前的可解释技术提出的解释方法为模型提供的解释不能够满足用户的解释需本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于专家交互学习的深度判别模型的解释结果修正方法,其特征在于,包括:S1:获取待解释图像,并将图像分成预测训练集、解释训练集,并对图像进行数据预处理;S2:通过预处理后的预测训练集对resnet18网络模型进行训练,并对训练完成后的resnet18网络模型加入修正模块,得到解释判别模型;S3:将预处理后的解释训练集中的图像输入解释判别模型,通过计算图像中每个像素的梯度值以及其在模型中的特征图,得到每个像素对模型决策的重要程度的可解释热力图;S4:通过专家知识对可解释热力图进行交互,当专家判断可解释热力图的解释正确时,对图像不进行操作;当专家判断可解释热力图的解释错误时,将解释错误的区域进行标注和选择模型应该正确解释的区域进行标注;S5:将标注信息输入解释判别模型的修正模块进行错误解释结果修正;S51:对标注出的解释错误的区域进行掩码,并通过损失函数修正错误的解释;S52:对标注出的模型应该正确解释的区域采用梯度区域检测技术提取出模型最关注的区域,并结合用户提供的正确解释区域,设计损失函数修正错误的解释;S6:对修正后的解释结果通过梯度区域检测,得到的梯度区域的像素个数以及用户提供的区域包含的像素个数,根据梯度区域的像素个数以及用户提供的区域包含的像素个数计算可解释评估指标,设定阈值,重复S5直到评估指标小于等于设定阈值,则完成解释修正。2.根据权利要求1所述的一种基于专家交互学习的深度判别模型的解释结果修正方法,其特征在于,对图像进行处理,包括:将图像尺寸重置为resnet18网络模型的输入尺寸,大小为224
×
224,对重置尺寸后的图像进行图像增强,得到预处理后的图像。3.根据权利要求1所述的一种基于专家交互学习的深度判别模型的解释结果修正方法,其特征在于,通过预测训练集对resnet18网络模型进行训练,得到训练完成的网络模型,包括:将预处理后的预测训练集中的图像输入resnet18网络模型,通过卷积核为7
×
7通道数为64步长为2的卷积层进行图像降维,将降维后的图像通过2个卷积核为3
×
3通道数为64、128、256和512的卷积层提取输入图像的特征,通过一个平均池化层、一个全连接层以及一个softmax层进行图像分类,完成resnet18网络模型的训练。4.根据权利要求1所述的一种基于专家交互学习的深度判别模型的解释结果修正方法,其特征在于,通过计算图像中每个像素的梯度值以及其在模型中的特征图,得到每个像素对模型决策的重要程度的可解释热力图,包括:素对模型决策的重要程度的可解释热力图,包括:其中,L
heatMap
表示每个像素对模型决策的重要程度的可解释热力图,A代表网络中的一
个特征层,k代表特征层A中的第k个通道,表示针对A
k
的权重,
c
表示类别,y
c
表示网络针对类别c预测的分数,表示特征层A在通道k中坐标为ij位置的...

【专利技术属性】
技术研发人员:王煜淇戴大伟夏书银王国胤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1