使用解纠缠学习来训练可解释的深度学习模型制造技术

技术编号：38713767 阅读：14 留言：0更新日期：2023-09-08 14:56

一种训练可解释的深度学习模型的方法和系统，包括接收可以是复杂的输入数据集。向深度学习模型提供输入数据集以用于特征提取。在示例性实施例中，深度学习模型根据特征提取生成特征的解纠缠潜在空间。特征可以包括语义上有意义的数据，该语义上有意义的数据然后被提供给低复杂度学习模型。低复杂度学习模型基于指定任务(例如，分类或回归)来生成输出。作为低复杂度学习模型，确信来自深度学习模型的数据输出本质上是可解释的。据输出本质上是可解释的。据输出本质上是可解释的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用解纠缠学习来训练可解释的深度学习模型

[0001]本公开大体上涉及数据处理，并且更具体地涉及使用解纠缠学习来训练可解释的深度学习模型的系统和方法。

技术介绍

[0002]神经网络通常被认为是模仿活脑的操作的技术。人工网络模拟决策层以执行指定的任务。任务例如包括特征的标识和分类。层可包括输入层、输出层和在其间的至少一个隐藏层。每一层在过程中执行特定类型的分选和排序，其中一些被称为“特征分层结构”。
[0003]为了更好地理解本公开的特征，讨论关于深度神经网络的已知内容可能是有帮助的。深度神经网络可以用于处理未标记的或非结构化的数据。深度学习表示一种机器学习的形式，其中使用人工智能的各方面的技术寻求以超越简单输入/输出协议的方式对信息进行分类和排序。深度神经网络提取对于人类而言通常难以解释或解释过度耗时的数据表示。可以通过最小用户干预提供来自复杂数据集的数据的有意义表达。
[0004]神经网络如何深度操作的大部分仍然是未知的和未解的。通常，在执行任务时，深度神经网络可以不被给予要遵循的规则或条件。深度学习对于其在处理大批次的数据时通过最小的用户干预提供的性能是有用的。
[0005]目前业界正在努力去好地理解和说明(解释)深度神经网络如何表现，使得可以改进建模。可解释性(或者，可说明性)与正在执行的任务有关。这意味着，例如，对于被分类为“狗”的输入图像，来自模型的说明指示输入图像的为什么或哪些特征对分类最负责。因此，试图说明分类(或者，回归)模型。
[0006]传统上，模型是针对特定任务...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种训练针对机器学习系统的可解释的深度学习模型的方法，包括：接收输入数据集；向深度神经网络模型提供所述输入数据集；从所述深度神经网络模型提取特征；生成包括所提取的所述特征的向量的潜在空间；向任务特定的模型馈送向量的所述潜在空间；以及从所述任务特定的模型生成特征维度的可解释预测。2.根据权利要求1所述的方法，其中所述特征使用编码器模块而被提取。3.根据权利要求1所述的方法，其中向量的所述潜在空间是所述输入数据集的解纠缠表示。4.根据权利要求1所述的方法，还包括使用贝塔变分自编码器从所述深度神经网络提取所述特征。5.根据权利要求1所述的方法，其中所述任务特定的模型是低复杂度学习模型。6.根据权利要求1所述的方法，还包括：将针对所述潜在空间中的每个向量的特征维度与语义上有意义的特性相关联；以及基于每个向量的所述语义上有意义的特性来生成特征维度的所述可解释预测。7.一种用于训练针对机器学习系统的可解释的深度学习模型的计算机程序产品，所述计算机程序产品包括：一个或多个计算机可读存储介质，以及被共同存储在所述一个或多个计算机可读存储介质上的程序指令，所述程序指令包括：接收输入数据集；向深度神经网络模型提供所述输入数据集；从所述深度神经网络模型提取特征；生成包括所提取的所述特征的向量的潜在空间；向任务特定的模型馈送向量的所述潜在空间；以及从所述任务特定的模型生成特征维度的可解释预测。8.根据权利要求7所述的计算机程序产品，其中所述特征使用编码器模块而被提取。9.根据权利要求7所述的计算机程序产品，其中向量的所述潜在空间是所述输入数据集的解纠缠表示。10.根据权利要求7所述的计算机程序产品，其中所述程序指令还包括使用贝塔变分自编码器从所述深度神经网络提取所述特征。11.根据权利要求7所述的计算机程序产品，其中所述任务特定的模型是低复杂度学习模型。12.根据权利要求7所述的计算机程序产品，其中所述程序指令还包括：将针对所述潜在空间中的每个向量的特征维度与语义上有意义的特性相关联；以及基于每个向量的所述语义上有意义的特性来生成特征维度的所述可解释预测。13.一种计算机服务器，包括：网络连接；一个或多个计算机可读存储介质；
处理器，所述处理器被耦合到所述网络连接并且被耦合到所述一个或多个计算机可读存储介质；以及计算机程序产品，所述计算机程序产品包括被共同存储在所述一个或多个计算机可读存储介质上的程序指令，所述程序指令包括：接收输入数据集；向深度神经网络模型提供所述输入数据集；从所述深度神经网络模型提取特征；生成包括所提取的所述特征的向量的潜在空间；向任务特定的模型馈送向量的所述潜在空间；以及从所述任务特定的模型生成特征维度的可解释预测。14.根据权利要求13所述的计算机服务器，其中所述特征使用编码器模...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人