一种最大化互信息的图像分类方法、设备、介质及系统技术方案

技术编号:31909835 阅读:33 留言:0更新日期:2022-01-15 12:49
本发明专利技术提供一种最大化互信息的图像分类方法、设备、介质及系统,包括:采集训练图像;最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。本发明专利技术基于给定图像数据,通过最大化互信息方式,自动设计确定神经网络的网络结构和参数,用于图像分类,无需繁杂的人工设计,节省人力资源和计算资源消耗。本发明专利技术能在极短的时间内,自动设计得到基于神经网络的图像分类方法,同时能实现较高的图像分类准确率。率。率。

【技术实现步骤摘要】
一种最大化互信息的图像分类方法、设备、介质及系统


[0001]本专利技术涉及人工智能和图像处理
,具体涉及一种最大化互信息的图像分类方法,及其计算机设备及可读存储介质。

技术介绍

[0002]随着大数据的发展和计算能力的提升,人工智能技术在近些年来取得了飞速的发展,工业界对于图像分类等图像处理的应用需求也越来越高。早期的图像处理受到采集设备的限制,得到图像质量不高,主要采用的技术是手工特征提取,一些手工设计的特征提取算子例如HoG和信号处理方法例如小波分析,促进了图像处理的早期发展。但是手工设计的特征提取算子是科学家基于对给定图像的先验认识和分析设计得到的,其不可避免地保留着人为先验带来的偏见,在图像分类任务上表现的性能始终无法超越人类。而神经网络则是将特征提取器和分类器联合在一起进行端到端的训练,大数据驱动的方式使得网络自动学习到最适用于图像分类目标的特征提取滤波器组。神经网络的出现摒弃了人为的手工设计特征提取算子,并且在图像分类任务上达到了超越人类专家的性能。虽然神经网络的出现使得人们无需手工设计特征提取算子,节省了人力资源消耗,并且本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种最大化互信息的图像分类方法,其特征在于,包括:采集训练图像;最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。2.根据权利要求1所述的最大化互信息的图像分类方法,其特征在于,将采集到的训练图像分为两部分;所述最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数,包括:构建超网络和结构生成网络,分别对其进行数据处理获得超网络的网络参数和结构生成网络的参数,并构建目标网络;将全部训练图像输入所述目标网络,生成预测的图像类别标签,根据所述预测的图像类别标签与真实的图像类别标签,计算图像分类的交叉熵损失,训练目标网络直至收敛,用于图像分类。3.根据权利要求2所述的最大化互信息的图像分类方法,其特征在于,所述构建超网络和结构生成网络,分别对其进行数据处理获得超网络的网络参数和结构生成网络的参数,并构建目标网络,包括:S1,基于图像分类所有可能的操作,构建基本单元;再利用所述基本单元构建超网络,其中:所述超网络是由包含所有可能的图像分类操作的基本单元堆叠而成;S2,基于卷积神经网络构建结构生成网络,从标准高斯分布中采样,得到采样值作为结构生成网络的输入,经过前向传播得到结构生成网络的输出;再从标准高斯分布中采样得到噪声;将所述结构生成网络的输出与所述采样得到的噪声求和作为超网络的结构参数;S3,将第一部分训练图像输入所述超网络,生成预测类别标签;根据所述预测类别标签与真实类别标签,计算图像分类交叉熵损失;利用梯度下降方法,根据所述图像分类交叉熵损失更新超网络的网络参数;S4,将第二部分训练图像输入所述超网络,最大化图像数据和超网络的结构参数的互信息,并确定互信息的下界,其中:互信息的下界为结构参数的后验分布和图像数据的后验分布的交叉熵损失,计算所述交叉熵损失,并利用梯度下降方法更新结构生成网络的参数;重复S2

S4不断迭代更新所述超网络的网络参数和结构生成网络的参数,直到收敛,将更新得到的新基本单元堆叠构建目标网络。4.根据权利要求3所述的最大化互信息的图像分类方法,其特征在于,所述结构生成网络,是指利用卷积神经网络、修...

【专利技术属性】
技术研发人员:戴文睿王曜明刘育辰李成林邹君妮熊红凯
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1