基于多维度注意力的图片分类方法、系统、设备及介质技术方案

技术编号：28873121 阅读：34 留言：0更新日期：2021-06-15 23:06

本发明专利技术提供了一种基于多维度注意力的图片分类方法，利用构建图片数据集，根据预设场景定义图片数据集中各个图片的图片分类标签；构建图片分类模型，图片分类模型中添加有多维度注意力机制；使用图片数据集训练图片分类模型；抽样测试和验证图片分类模型，根据测试结果优化图片分类模型；将待分类的图片输入图片分类模型，得到输出的分类结果。该图片分类方法通过多维度注意力机制模块，重新设计并训练深度学习模型，能够实现轻量级、快速、高准确率的山岳峰谷场景图像分类任务，可替代人工审核分类工作，大幅度节约人工运营成本，提高图像利用效率，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于多维度注意力的图片分类方法、系统、设备及介质
本专利技术涉及图片分类的
，尤其涉及一种基于多维度注意力的图片分类方法、系统、设备及存储介质。
技术介绍
对于种类繁多的图片如何精准的理解图片中的内容并准确的分类成为研究的热点，也是实际应用场景下急需解决的问题。近年来，注意力机制的引入为图像分类任务注入了新的活力，但是这些基于注意力机制的算法往往仅关注某一维度的特征，准确度低，用于审核的人力成本高，总体效率低下。
技术实现思路
针对现有技术中的问题，本专利技术的目的在于提供一种基于多维度注意力的图片分类方法、系统、设备及介质，能够通过多维度注意力机制模块，重新设计并训练深度学习模型，能够实现轻量级、快速、高准确率的图片分类任务。本专利技术实施例提供一种基于多维度注意力的图片分类方法，包括如下步骤：构建图片数据集，根据预设场景定义所述图片数据集中各个图片的图片分类标签；构建图片分类模型，所述图片分类模型中添加有多维度注意力机制；使用所述图片数据集训练所述图片分类...

【技术保护点】
1.一种基于多维度注意力的图片分类方法，其特征在于，包括以下步骤：/n构建图片数据集，根据预设场景定义所述图片数据集中各个图片的图片分类标签；/n构建图片分类模型，所述图片分类模型中添加有多维度注意力机制；/n使用所述图片数据集训练所述图片分类模型；/n抽样测试和验证所述图片分类模型，根据测试结果优化所述图片分类模型；/n将待分类的图片输入所述图片分类模型，得到输出的分类结果。/n

【技术特征摘要】
1.一种基于多维度注意力的图片分类方法，其特征在于，包括以下步骤：
构建图片数据集，根据预设场景定义所述图片数据集中各个图片的图片分类标签；
构建图片分类模型，所述图片分类模型中添加有多维度注意力机制；
使用所述图片数据集训练所述图片分类模型；
抽样测试和验证所述图片分类模型，根据测试结果优化所述图片分类模型；
将待分类的图片输入所述图片分类模型，得到输出的分类结果。

2.根据权利要求1所述的图片分类方法，其特征在于，根据预设场景定义所述图片数据集中各个图片的图片分类标签步骤包括：
根据预设场景定义多个图片分类标签，所述图片分类标签与所述预设场景相对应；
依据所述图片分类标签将所述图片数据集中的图片分类；
将不属于所述图片分类标签的图片定义为其他标签。

3.根据权利要求1所述的图片分类方法，其特征在于，构建图片分类模型的步骤包括：
采用基于开源数据预训练的wideresnet50模型构建图片分类模型的基础模型结构；
在所述基础模型结构中加入多维度注意力机制模块，所述多维度注意力机制模块用于对中间特征图和最终特征图基于多维度注意力机制进行调整，得到图片分类模型。

4.根据权利要求3所述的图片分类方法，其特征在于，所述wideresnet50模型包括依次串联的第一卷积结构、第二卷积结构、第三卷积结构、第四卷积结构和第五卷积结构，分别在所述第三卷积结构和所述第五卷积结构之后加入所述多维度注意力机制模块，得到所述图片分类模型。

5.根据权利要求4所述的图片分类方法，其特征在于，所述训练图片分类模型的步骤包括：
采用加权的交叉熵构建模型的损失函数，计算模型损失；
使用自适应矩估计优化器更新所述图片分类模型的权重，其中每20个时期学习率衰减为原来的0.1倍；
设置第一学习率lr1和第二学习率lr2，其中lr1＞lr2，采用所述第一学习率lr2训练所述wideresn...

【专利技术属性】
技术研发人员：康睿文，成丹妮，罗超，胡泓，李巍，邹宇，
申请(专利权)人：携程计算机技术上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人