一种信息优化模型的学习方法、存储介质及程序产品技术

技术编号:33387725 阅读:29 留言:0更新日期:2022-05-11 23:03
本申请涉及一种信息优化模型的学习方法、存储介质及程序产品。所述方法包括:将预处理后的训练样本输入到信息优化编码模块中基于采样层、小样本卷积核学习层学习,得到卷积核参数;通过卷积核参数构造卷积层,并利用构造的卷积层提取预处理后的训练样本的特征记作第一特征;基于池化层对第一特征进行提取得到第二特征;将第二特征输入到正负样本惩罚学习模块中基于正负样本分组得到特征组;将特征组展开后输入到正负样本惩罚学习模块中的信息优化层进行学习,并利用互信息最大化目标函数得到学习好的特征变换参数;基于学习好的特征变换参数对正负样本的分组进行信息计算及分类学习。本申请即使在小样本情况下也能获得最大的信息量。大的信息量。大的信息量。

【技术实现步骤摘要】
一种信息优化模型的学习方法、存储介质及程序产品


[0001]本申请涉及深度学习及信息优化
,更为具体来说,本申请涉及一种信息优化模型的学习方法、存储介质及程序产品。

技术介绍

[0002]近年来,在大数据的驱动下,深度学习在场景分类、目标识别、语音识别等任务中取得了令人瞩目的成果。但现有深度学习的成功,很大程度上依赖于大量标签数据。而在实际问题中,某些特殊场景和识别任务只包含少量标注数据或少量数据,且对数据进行标注需要耗费巨大的时间和人力成本。
[0003]此外,现实场景中的目标类别呈现长尾型分布,数据丰富的类别只是占总类别的小部分,人们感兴趣的目标类别往往难以获取其训练数据。由此可以看出,如何利用少量样本即小样本数据构建应用任务的模型,获取信息量的最大化对于深度学习的实际应用和探索新的机器学习机制是亟待解决的技术问题。

技术实现思路

[0004]基于上述技术问题,本专利技术旨在基于小样本数据构建应用任务的信息优化模型,针对该信息优化模型采用新的学习方法,以在小样本数据情况下获得最大的信息量。<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息优化模型的学习方法,其特征在于,所述信息优化模型包括信息优化编码模块和正负样本惩罚学习模块,所述学习方法包括:获取训练样本并对所述训练样本进行预处理;将预处理后的训练样本输入到信息优化编码模块中基于采样层、小样本卷积核学习层学习,得到卷积核个数;通过所述卷积核个数构造卷积层,并利用构造的卷积层提取预处理后的训练样本的特征记作第一特征;基于池化层对所述第一特征进行提取得到第二特征;将所述第二特征输入到正负样本惩罚学习模块中基于正负样本分组得到特征组;将所述特征组展开后输入到正负样本惩罚学习模块中的信息优化层进行学习,并利用互信息最大化目标函数得到学习好的特征变换参数;基于所述学习好的特征变换参数对正负样本的分组进行信息计算及分类学习,以获得信息量最大的组。2.根据权利要求1所述的信息优化模型的学习方法,其特征在于,将所述特征组展开后输入到正负样本惩罚学习模块中的信息优化层进行学习,并利用互信息最大化目标函数得到学习好的特征变换参数,包括:将所述特征组展开成一维数据记作第三特征;将所述第三特征输入到正负样本惩罚学习模块中的信息优化层进行学习;利用互信息最大化目标函数构造信息优化层的特征变换参数。3.根据权利要求2所述的信息优化模型的学习方法,其特征在于,所述方法还包括:基于所述特征变换参数得到信息优化层中的卷积核个数;根据所述卷积核个数构造信息优化层的卷积层;基于构造的信息优化层的卷积层处理并输出从信息优化编码模块输入的结果。4.根据权利要求2所述的信息优化模型的学习方法,其特征在于,所述利用互信息最大化目标函数构造信息优化层的特征变换参数,包括:设计互信息最大化目标函数,其中,所述互信息最大化目标函数中包括正负样本信息量之间的最小间隔和特征变换参数;利用梯度下降法对所述最...

【专利技术属性】
技术研发人员:袁森饶梦彬黄文涛
申请(专利权)人:中国电子科技集团公司信息科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1