【技术实现步骤摘要】
【国外来华专利技术】随时间推移使用深度学习网络的系统和方法
技术介绍
本说明书的实施方案整体涉及深度学习网络,并且更具体地涉及用于终生学习的系统和方法。深度学习系统越来越多地用于解决现实世界问题,诸如,多维医学图像数据集的分析、海量生物数据中的知识发现、自适应语音识别、自适应智能预测和控制系统、能够适应和学习的基于人工智能的工业系统等。此类系统被配置为在特定背景中学习给定训练数据集。通常,深度学习网络是基于人工神经网络,并且学习算法是基于多层感知器(MLP)和反向传播技术。然而,已建立的神经网络和人工智能(AI)技术在应用于基于在线知识的学习时具有困难。在许多场景中,常规深度学习算法缺乏在部署之后连续学习的能力。在其他情况下,用来自同一任务的更多数据增量地调整深度学习网络或从旧数据集或新数据集学习新任务的要求未得到充分满足。照惯例,可采用来自先前任务的演练重放信息技术来为较新的场景重新训练神经网络。然而,此类技术需要过多且不断增加的数据存储容量,这在诸如医疗保健和工业应用的领域中可能是禁止的。进一步地,演练重放还需要更高的计算能力并且需要更长的训练持续时间来生成适应性学习网络。固定特征表示学习重新训练了分类层,而增量演进表示学习技术则针对的是用较新的任务和数据集来演进网络。然而,重新训练深度学习网络的朴素方法会导致失败,因为网络忘记了其最初被设计用于的先前任务。已尝试通过模拟生成旧数据表示来进行伪重放,以避免朴素学习的失败以及在不需要存储旧数据集的情况下模仿演练重放。然而,这些方法的性能仍与基线方法(完整的重新训练)相距甚远并且需要进 ...
【技术保护点】
1.一种用于随时间推移更新深度学习网络的方法,所述方法包括以下步骤:/n从深度学习网络接收第一组参数,其中所述深度学习网络使用第一训练数据集来进行训练以执行第一组任务,其中所述第一组参数指定用于执行所述第一组任务的第一特征提取器和第一分类器中的一者或两者;/n接收对应于所述第一训练数据集的第一特征集;/n接收包括第二组任务和第二训练数据集的输入;/n生成第二组参数,所述第二组参数指定第二特征提取器和第二分类器中的一者或两者,以供所述深度学习网络使用,其中所述第二组参数是使用所述第一组参数、所述输入和所述第一特征集来生成的;以及/n修改所述深度学习网络以使用所述第二组参数,使得所述深度学习网络被训练为在不劣化的情况下执行来自所述第一组任务和所述第二组任务的任务。/n
【技术特征摘要】
【国外来华专利技术】20180927 IN 201841036423;20190725 US 16/522,3671.一种用于随时间推移更新深度学习网络的方法,所述方法包括以下步骤:
从深度学习网络接收第一组参数,其中所述深度学习网络使用第一训练数据集来进行训练以执行第一组任务,其中所述第一组参数指定用于执行所述第一组任务的第一特征提取器和第一分类器中的一者或两者;
接收对应于所述第一训练数据集的第一特征集;
接收包括第二组任务和第二训练数据集的输入;
生成第二组参数,所述第二组参数指定第二特征提取器和第二分类器中的一者或两者,以供所述深度学习网络使用,其中所述第二组参数是使用所述第一组参数、所述输入和所述第一特征集来生成的;以及
修改所述深度学习网络以使用所述第二组参数,使得所述深度学习网络被训练为在不劣化的情况下执行来自所述第一组任务和所述第二组任务的任务。
2.根据权利要求1所述的方法,其中所述深度学习网络包括记忆增强神经网络。
3.根据权利要求2所述的方法,其中所述第一特征集被存储在所述记忆增强神经网络的存储器中。
4.根据权利要求1所述的方法,其中所述深度学习网络被训练为处理医学图像或工业图像中的一者或多者。
5.根据权利要求1所述的方法,其中所述第一组参数是通过使用所述第一训练数据集训练所述深度学习网络以执行所述第一组任务来生成。
6.根据权利要求1所述的方法,其中所述第二组参数使得所述深度学习网络能够在不劣化的情况下执行来自第一任务列表的所述任务。
7.根据权利要求1所述的方法,其中所述方法的所述步骤是在与所述深度学习网络相关联的学习单元上执行,并且使用所述学习单元的一个或多个处理器单元和至少一个存储器单元来实现。
8.根据权利要求7所述的方法,其中所述学习单元包括数据集发生器,所述数据集发生器被配置为接收至少所述第一组参数、所述第一特征集和所述第二训练数据集,以及基于所述第一特征提取器和所述第二训练数据集来生成中间特征集。
9.根据权利要求7所述的方法,其中所述学习单元包括特征变换器单元,所述特征变换器单元被配置为至少基于所述第二训练数据集来训练特征变换器。
10.根据权利要求9所述的方法,其中所述特征变换器是通过使模型损失成本函数最小化来训练。
11.根据权利要求7所述的方法,其中所述学习单元包括深度学习网络参数发生器,所述深度学习网络参数发生器被配置为至少基于特征变换器来生成所述第二组参数。
<...
【专利技术属性】
技术研发人员:拉胡尔·文卡塔拉马尼,S·安那曼德拉,哈里哈兰·瑞维享卡,普拉撒度·苏达卡尔,
申请(专利权)人:通用电气公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。