【技术实现步骤摘要】
本专利技术属于图像模型优化,更具体的说是涉及一种图像识别与分类方法、系统、设备及介质。
技术介绍
1、在计算机视觉领域,深度神经网络已成为图像识别与分类任务的核心解决方案。主流模型如卷积神经网络(cnn)和视觉transformer(vit)通过堆叠密集的参数量与计算单元,在imagenet分类、目标检测等基准任务中取得了显著进展。例如,resnet系列通过深层残差连接实现了特征复用,而vision transformer及其变种则利用自注意力机制建模全局依赖关系。然而,这类密集型网络存在固有缺陷:其计算复杂度与模型容量在训练前即被固定,无法根据输入数据的复杂程度进行动态调整。
2、具体而言,对于包含简单场景或常见物体的图像(如单一物体居中拍摄的图像),网络仍需激活全部参数进行推理,导致大量冗余计算;而对于包含复杂背景、多尺度目标或遮挡场景的图像(如密集城市街景),固定容量的模型又可能因表征能力不足而降低分类精度。
3、现有改进方案主要聚焦于静态模型压缩或级联式推理,但存在显著局限性。例如,知识蒸馏通过训练小型学
...【技术保护点】
1.一种图像识别与分类方法,其特征在于,包括:
2.根据权利要求1所述的图像识别与分类方法,其特征在于,所述获取待处理的图像,对所述图像进行归一化和缩放处理,生成目标图像,包括:
3.根据权利要求2所述的图像识别与分类方法,其特征在于,所述对目标图像进行分块处理和向量化处理,生成多个包含一维向量的图像块,作为初始特征向量,包括:
4.根据权利要求3所述的图像识别与分类方法,其特征在于,所述将所述初始特征向量输入到混合专家模块中,通过门控机制计算专家网络的路由权重,包括:
5.根据权利要求4所述的图像识别与分类方法,其特征
...【技术特征摘要】
1.一种图像识别与分类方法,其特征在于,包括:
2.根据权利要求1所述的图像识别与分类方法,其特征在于,所述获取待处理的图像,对所述图像进行归一化和缩放处理,生成目标图像,包括:
3.根据权利要求2所述的图像识别与分类方法,其特征在于,所述对目标图像进行分块处理和向量化处理,生成多个包含一维向量的图像块,作为初始特征向量,包括:
4.根据权利要求3所述的图像识别与分类方法,其特征在于,所述将所述初始特征向量输入到混合专家模块中,通过门控机制计算专家网络的路由权重,包括:
5.根据权利要求4所述的图像识别与分类方法,其特征在于,所述基于计算出的路由权重,采用稀疏激活机制激活处理数据的专家网络,包括:
6.根据权利要求5所述的图像识别与分类方法,其特征在于...
【专利技术属性】
技术研发人员:夏娉,付金涛,周冬,李晨,
申请(专利权)人:浪潮智慧科技南京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。