深度神经网络的解释方法、装置、终端及存储介质制造方法及图纸

技术编号：26067334 阅读：34 留言：0更新日期：2020-10-28 16:40

本发明专利技术提出一种深度神经网络的解释方法、装置、终端及存储介质，涉及人工智能技术领域，具体公开了通过深度神经网络输出的结果从输入的多个数据中确定所有的目标数据，再将目标数据分别输入至解释因子预测模型中，得到每个目标数据对应的一组解释因子，再统计多组解释因子中每个解释因子的出现次数并排序后，筛选排名最高的目标数量个解释因子作为预设目标类别的目标解释因子。本发明专利技术通过预先训练好的解释因子预测模型得到预测结果的解释因子，以解释影响深度神经网络预测结果主要因素，其可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通场景中，从而推动智慧城市的建设。

全部详细技术资料下载

【技术实现步骤摘要】
深度神经网络的解释方法、装置、终端及存储介质
本专利技术涉及人工智能
，尤其涉及一种深度神经网络的解释方法、装置、终端及存储介质。
技术介绍
神经网络算法，是20世纪80年代以来人工智能领域兴起的研究热点。它从信息处理角度对神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。其具有自主学习功能，可通过训练慢慢学会识别和预测；联想存储功能，具有很高算法健壮性；并行度高，具有高速寻找优化解的能力，可针对大数据复杂问题快速找到优化解；可塑性强，可充分逼近任意复杂的非线性关系；具有很强的信息综合能力，能同时处理定量和定性的信息，适用于多信息融合和多媒体技术。近年来，神经网络的研究工作不断深入，已经取得了很大的进展，其在图像处理、模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多传统计算机方法难以解决的实际问题，表现出了良好的智能特性，推动着信息处理技术和人工智能不断地发展。深度神经网络模型的可解释性一直是业内的重点关注领域，模型的可解释性对于模型改进和模型可信性与透明度都有重要作用。特征可视化是目前常用的神经网络的解释方法，其寻找模型输入中各个区域对模型预测的影响并进行可视化表示，可以在一定程度上说明模型的关注点，但是在实际应用中，仅通过特征可视化很难对模型进行定量的解释，也不能反映影响模型判断的主要因素，无法很好的解释模型是根据哪些因子得到的预测结果。
技术实现思路
本专利技术提供一种深度神经网络的解释方法、装置、终端及存储介质，以解决难以...

【技术保护点】
1.一种深度神经网络的解释方法，其特征在于，包括：/n输入多个数据至训练好的深度神经网络模型中，得到每一个数据对应的第一预测类别；/n当所述第一预测类别为预设目标类别时，将所述第一预测类别对应的目标数据输入至解释因子预测模型中，以得到所述预设目标类别对应的解释因子，所述解释因子预测模型根据预先设定的目标数量和所述预设目标类别的第一预测值训练得到；/n统计每一个解释因子的出现次数并排序后，筛选排名最高的所述目标数量个解释因子作为所述预设目标类别的目标解释因子。/n

【技术特征摘要】
1.一种深度神经网络的解释方法，其特征在于，包括：
输入多个数据至训练好的深度神经网络模型中，得到每一个数据对应的第一预测类别；
当所述第一预测类别为预设目标类别时，将所述第一预测类别对应的目标数据输入至解释因子预测模型中，以得到所述预设目标类别对应的解释因子，所述解释因子预测模型根据预先设定的目标数量和所述预设目标类别的第一预测值训练得到；
统计每一个解释因子的出现次数并排序后，筛选排名最高的所述目标数量个解释因子作为所述预设目标类别的目标解释因子。

2.根据权利要求1所述的方法，其特征在于，还包括预先训练所述解释因子预测模型，包括：
逐个输入样本至所述训练好的深度神经网络模型中，得到每个样本对应的预测类别以及第一预测值；
当所述预测类别为预设目标类别时，将所述预测类别对应的目标样本输入至所述解释因子预测模型中，得到每个解释因子的第二预测值；
根据所述第一预测值、所述第二预测值和所述目标数量构建解释因子标签；
基于所述解释因子标签和所述第二预测值反向传播更新所述解释因子预测模型；
循环执行上述步骤直至所述解释因子预测模型收敛，并将收敛的解释因子预测模型与所述预设目标类别绑定。

3.根据权利要求2所述的方法，其特征在于，所述利用所述第一预测值、所述每个解释因子的第二预测值和所述目标数量构建解释因子标签，包括：
根据所述第一预测值和所述目标数量计算所有的解释因子中取值为1的解释因子的数目w，w＝ceil(m×Sk)，其中，ceil表示向上取整，m表示所述目标数量，Sk表示所述第一预测值；
根据所述每个解释因子的第二预测值的大小，将所述第二预测值最大的所述w个解释因子的值设置为1，将其余的解释因子的值设置为0，得到所述解释因子标签。

4.根据权利要求2所述的方法，其特征在于，所述逐个输入样本至所述训练好的深度神经网络模型中之前，还包括：
获取用户预先输入的至少一个预设目标类别，以及每个预设目标类别对应的目标解释因子的目标数量。

【专利技术属性】
技术研发人员：陈筱，周细文，庄伯金，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人