一种基于马尔科夫轻量化注意力机制的图像识别方法技术

技术编号：40968455 阅读：25 留言：0更新日期：2024-04-18 20:49

本发明专利技术属于图像识别技术领域，提出了一种基于马尔科夫轻量化注意力机制的图像识别方法。该方法包括以下步骤：步骤S1、建立图像识别训练集，获取多张图像，对图像进行数据增强、规范化，获得训练集；步骤S2、采用所述训练集对Vision Transformer模型进行分类任务训练；步骤S3、基于训练好的Vision Transformer模型实现对待识别图像的特征识别。本发明专利技术通过使用马尔科夫稳态向量取代注意力机制中的权重矩阵，降低了注意力机制的资源占用，大大提升了图像识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像识别，特别是涉及一种基于马尔科夫轻量化注意力机制的图像识别方法。

技术介绍

1、目前以注意力机制为基础的图像识别大模型资源占用越来越多。因此，图像识别大模型的轻量化设计日益重要。轻量化是一种将大型神经网络模型变得更加小巧、高效的技术。这一技术的目标是在保持模型性能的同时，减少其内存占用和计算资源需求，从而使其更适合在资源受限的环境中运行，比如移动设备、嵌入式系统或边缘计算设备。

2、现有的大模型轻量化方法主要包括：

3、模型剪枝(model pruning)：这是最常见的轻量化技术之一。模型剪枝通过删除神经网络中不必要的连接和参数来减小模型的大小。通常，这些连接和参数对于模型的性能并不是必不可少的。

4、量化(quantization)：量化是将神经网络的权重和激活值从浮点数转换为较低位数的整数或定点数的过程，减小了模型的内存占用和计算需求，但可能会引起一些精度损失。

5、模型蒸馏(model distillation)：模型蒸馏是一种训练轻量模型的方法，其中轻量模型被设...

【技术保护点】

1.一种基于马尔科夫轻量化注意力机制的图像识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的图像识别方法，其特征在于，所述Vision Transformer模型包括特征提取模块、自注意力机制模块和多尺度特征融合模块。

3.根据权利要求2所述的图像识别方法，其特征在于，所述特征提取模块将图像划分为多个重叠的小块，每个小块包含图像的局部信息，并通过线性投影或卷积将每个小块转换为向量。

4.根据权利要求2所述的图像识别方法，其特征在于，所述自注意力机制模块用于捕捉并输出图像中的长程依赖关系，包括多个注意力头，计算方式如下：</p>

5.根据...

【技术特征摘要】

1.一种基于马尔科夫轻量化注意力机制的图像识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的图像识别方法，其特征在于，所述vision transformer模型包括特征提取模块、自注意力机制模块和多尺度特征融合模块。

3.根据权利要求2所述的图像识别方法，其特征在于，所述特征提取模块将图像划分为多个重叠的小块，每个小块包含图像的局部信息，并通过线性投影...

【专利技术属性】
技术研发人员：林一夫，李文玲，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人