当前位置: 首页 > 专利查询>清华大学专利>正文

任务不可知连续学习场景的元空间聚类学习方法及装置制造方法及图纸

技术编号:24290099 阅读:100 留言:0更新日期:2020-05-26 20:15
本发明专利技术公开了一种任务不可知连续学习场景的元空间聚类学习方法及装置,该方法包括:获取训练数据集,训练数据集的分布数目为未知数K;通过卷积神经网络提取训练数据集的数据特征,对提取的数据特征进行聚类;判断聚类的数据特征是否满足增加新聚类的条件,若满足,则分布数目K增加1,若不满足,则将聚类的数据特征归类到已经存在的聚类数据中;训练数据聚类完成后,利用所有的聚类数据的聚类信息训练动态分类网络,通过训练好的动态分类网络对不同聚类的数据进行分类。该方法解决了模型在任务不可知场景下连续学习的灾难性遗忘问题及提高模型在多任务之间的迁移能力。

Meta space clustering learning method and device for task agnostic continuous learning scene

【技术实现步骤摘要】
任务不可知连续学习场景的元空间聚类学习方法及装置
本专利技术涉及机器学习
,特别涉及一种任务不可知连续学习场景的元空间聚类学习方法及装置。
技术介绍
在统计机器学习系统和深度学习系统投入使用时,要求模型学习到的输入数据和输出数据的分布和要进行测试的分布是一致的。在单一任务的机器学习场景下,统计机器学习模型或深度神经网络模型的可行性和有效性取决于一个假设:输入和输出数据的分布不会随时间发生显著变化;否则会使得模型原本学习到的模式和复杂关系表现不佳或甚至完全不可用。但在真实世界中,这样的假设条件很少能够成立。以人类的认知学习为例,人类大脑在学习过程中,能够应对输入数据随时间变化的显著性和多样性,这是目前针对单一任务的机器学习模型不能够适应的。因此,深度神经网络的连续学习问题得到了越来越多的关注。连续学习场景不同于传统单一任务的机器学习场景,也不同于多任务同时学习的场景。单一任务的学习场景中,训练数据和测试数据都是独立同分布的,机器学习算法可以在训练数据上训练出表现比较好的模型;在多任务同时学习的场景中,多个任务的数据是完全可知的,模型本文档来自技高网...

【技术保护点】
1.一种任务不可知连续学习场景的元空间聚类学习方法,其特征在于,包括以下步骤:/n获取训练数据集,所述训练数据集的分布数目为未知数K;/n通过卷积神经网络提取所述训练数据集的数据特征,对提取的所述数据特征进行聚类;/n判断聚类的数据特征是否满足增加新聚类的条件,若满足,则分布数目K增加1,若不满足,则将所述聚类的数据特征归类到已经存在的聚类数据中;/n所述训练数据聚类完成后,利用所有的聚类数据的聚类信息训练动态分类网络,通过训练好的动态分类网络对不同聚类的数据进行分类。/n

【技术特征摘要】
1.一种任务不可知连续学习场景的元空间聚类学习方法,其特征在于,包括以下步骤:
获取训练数据集,所述训练数据集的分布数目为未知数K;
通过卷积神经网络提取所述训练数据集的数据特征,对提取的所述数据特征进行聚类;
判断聚类的数据特征是否满足增加新聚类的条件,若满足,则分布数目K增加1,若不满足,则将所述聚类的数据特征归类到已经存在的聚类数据中;
所述训练数据聚类完成后,利用所有的聚类数据的聚类信息训练动态分类网络,通过训练好的动态分类网络对不同聚类的数据进行分类。


2.根据权利要求1所述的任务不可知连续学习场景的元空间聚类学习方法,其特征在于,还包括:
在所述动态分类网络训练完成后,通过测试数据集进行测试,根据测试结果对所述动态分类网络进行调整。


3.根据权利要求1所述的任务不可知连续学习场景的元空间聚类学习方法,其特征在于,
所述训练数据集采样自分布数目K不可知的混合高斯模型。


4.根据权利要求1所述的任务不可知连续学习场景的元空间聚类学习方法,其特征在于,所述利用所有的聚类数据的聚类信息训练动态分类网络包括:
以聚类信息作为条件,不同聚类数据对应不同的分类参数对所述动态分类网络进行训练。


5.根据权利要求1所述的任务不可知连续学习场景的元空间聚类学习方法,其特征在于,所述判断聚类的数据特征是否满足增加新聚类的条件,包括:
计算所述聚类的数据特征与已有的多个聚类数据的聚类中心的距离,判断多个距离中的最小值是否大于预设阈值,若大于,则分布数目K增加1,反之,则将所述聚类的数据特征归类到多个距离中的最小值对应的聚类数据中。


6.一种任务不可知连续学习...

【专利技术属性】
技术研发人员:朱文武刘月王鑫
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1