图像分类方法及装置、计算机程序产品、电子设备制造方法及图纸

技术编号:43837163 阅读:19 留言:0更新日期:2024-12-31 18:34
本申请公开了一种图像分类方法及装置、计算机程序产品、电子设备。其中,该方法包括:获取目标图像;利用预训练的至少两个分类模型对目标图像进行分析,得到各个分类模型输出的第一预测分类结果;在各个分类模型输出的第一预测分类结果一致时,将第一预测分类结果作为目标图像的第一分类结果;在各个分类模型输出的第一预测分类结果不一致时,对目标图像进行第一处理操作,并利用至少两个分类模型对处理后的目标图像进行分析,得到各个分类模型输出的第二预测分类结果,基于各个分类模型输出的第一预测分类结果和第二预测分类结果确定目标图像的第一分类结果。本申请解决了由于相关技术对高清图像进行分类的准确性较低、成本较高的技术问题。

【技术实现步骤摘要】

本申请涉及图像处理,具体而言,涉及一种图像分类方法及装置、计算机程序产品、电子设备


技术介绍

1、在常见的图像分类任务中,由于图像通常具有数十万像素,而超高清图像的像素数量可能达到数亿级别,这超出了现有的图像分类网络的处理能力。为了对这类超高清图像进行分类,相关技术人员通常是采用滑动窗口的方式来处理这种大像素图像。

2、具体地,滑动窗口方法是将大像素图像分割成多个较小的窗口,如大小为(1024,1024)的窗口尺寸。在数亿像素的图像中,但即使这样,一张超高清图像也会生成数十甚至上百个分割区域,且这些分割区域被视为独立的图像块进行处理和分类。但上述方法仍存在如下挑战和限制:首先,滑动窗口方法需要大量的计算资源和存储空间来处理大量的图像块,这导致训练时间长且计算成本高昂;其次,由于图像的全局信息被切割,故而会导致分类性能下降,最终分类结果的准确性较差。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种图像分类方法及装置、计算机程序产品、电子设备,本文档来自技高网...

【技术保护点】

1.一种图像分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个所述分类模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,获取多组训练样本,包括:

4.根据权利要求3所述的方法,其特征在于,利用多组所述训练样本对所述初始神经网络模型进行迭代训练,得到所述分类模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述MBConv模块内至少包括:深度可分离卷积层、二维卷积层、压缩和激励网络SE模块,其中,利用多个所述MBConv模块对所述第一特征图依次进行深度特征提取,得到第二特征图,包括:

...

【技术特征摘要】

1.一种图像分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个所述分类模型的训练过程包括:

3.根据权利要求2所述的方法,其特征在于,获取多组训练样本,包括:

4.根据权利要求3所述的方法,其特征在于,利用多组所述训练样本对所述初始神经网络模型进行迭代训练,得到所述分类模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述mbconv模块内至少包括:深度可分离卷积层、二维卷积层、压缩和激励网络se模块,其中,利用多个所述mbconv模块对所述第一特征图依次进行深度特征提取,得到第二特征图,包括:

6.根据权利要求5所述的方法,其特征在于,所述se模块...

【专利技术属性】
技术研发人员:赵健
申请(专利权)人:中电信人工智能科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1