System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像分类模型训练方法、装置以及存储介质制造方法及图纸_技高网

图像分类模型训练方法、装置以及存储介质制造方法及图纸

技术编号:40872339 阅读:4 留言:0更新日期:2024-04-08 16:40
本公开提出一种图像分类模型训练方法、装置以及存储介质,方法包括:获取训练样本图像,并基于训练样本图像对基础网络模型进行前向训练,以确定多个类别项的预测值,其中,基础网络模型植入由通道注意力模块和空间注意力模块构成的混合注意力模块,并根据预测值确定多个类别项中的风险类别项,并计算风险类别项的第一损失值,并计算多个类别项的第二损失值,并根据第一损失值和第二损失值确定第三损失值,以及基于第三损失值,对基础网络模型的模型参数进行反向传播修正,直至基础网络模型收敛,以得到目标分类模型,能够对错误率较大的风险项进行约束,实现对训练过程进行调节;引入混合注意力模块可以提高模型特征提取的性能,提高分类准确率。

【技术实现步骤摘要】

本公开涉及深度学习,尤其涉及一种图像分类模型训练方法、装置以及存储介质


技术介绍

1、随着人工智能技术的发展,深度学习模型被广泛应用于多种应用场景执行分类任务。例如,在现实中的生活垃圾分类场景,利用深度学习模型对垃圾的图像进行识别,实现垃圾分类的目的。然而,相关技术没有考虑错误率较大的风险项对模型训练过程的影响,并且模型对图像特征提取的不够全面,因此,分类准确率还有待提升。


技术实现思路

1、本公开提出了一种图像分类模型训练方法、装置以及存储介质,旨在至少在一定程度上解决相关技术中的技术问题之一。

2、本公开第一方面实施例提出了一种图像分类模型训练方法,包括:获取训练样本图像;基于训练样本图像对基础网络模型进行前向训练,以确定多个类别项的预测值,其中,基础网络模型植入由通道注意力模块和空间注意力模块构成的混合注意力模块;根据预测值确定多个类别项中的风险类别项,并计算风险类别项的第一损失值;计算多个类别项的第二损失值,并根据第一损失值和第二损失值确定第三损失值;以及基于第三损失值,对基础网络模型的模型参数进行反向传播修正,直至基础网络模型收敛,以得到目标分类模型。

3、本公开第二方面实施例提出了一种图像分类模型训练装置,包括:第一获取模块,用于获取训练样本图像;训练模块,用于基于训练样本图像对基础网络模型进行前向训练,以确定多个类别项的预测值,其中,基础网络模型植入由通道注意力模块和空间注意力模块构成的混合注意力模块;第一计算模块,用于根据预测值确定多个类别项中的风险类别项,并计算风险类别项的第一损失值;第二计算模块,用于计算多个类别项的第二损失值,并根据第一损失值和第二损失值确定第三损失值;以及修正模块,用于基于第三损失值,对基础网络模型的模型参数进行反向传播修正,直至基础网络模型收敛,以得到目标分类模型。

4、本公开第三方面实施例提出了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例的图像分类模型训练方法。

5、本公开第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的图像分类模型训练方法。

6、本实施例中,通过获取训练样本图像,并基于训练样本图像对基础网络模型进行前向训练,以确定多个类别项的预测值,其中,基础网络模型植入由通道注意力模块和空间注意力模块构成的混合注意力模块,并根据预测值确定多个类别项中的风险类别项,并计算风险类别项的第一损失值,并计算多个类别项的第二损失值,并根据第一损失值和第二损失值确定第三损失值,以及基于第三损失值,对基础网络模型的模型参数进行反向传播修正,直至基础网络模型收敛,以得到目标分类模型,能够对错误率较大的风险项进行约束,实现对训练过程进行调节;此外,引入混合注意力模块可以提高模型特征提取的性能,能够较好的解决分类过程中容易混淆难以区分的问题,提高分类准确率。

7、本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种图像分类模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据以下公式计算所述第一损失值:

3.如权利要求2所述的方法,其特征在于,根据以下公式计算所述第二损失值:

4.如权利要求3所述的方法,其特征在于,所述第三损失值表示为:

5.如权利要求2所述的方法,其特征在于,根据以下任一项计算所述第一损失值:

6.如权利要求1所述的方法,其特征在于,所述根据所述预测值确定所述多个类别项中的风险类别项,包括:

7.如权利要求1所述的方法,其特征在于,所述通道注意力模块包括:

8.如权利要求7所述的方法,其特征在于,所述空间注意力模块包括:

9.如权利要求1所述的方法,其特征在于,所述得到目标分类模型之后,还包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

【技术特征摘要】

1.一种图像分类模型训练方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据以下公式计算所述第一损失值:

3.如权利要求2所述的方法,其特征在于,根据以下公式计算所述第二损失值:

4.如权利要求3所述的方法,其特征在于,所述第三损失值表示为:

5.如权利要求2所述的方法,其特征在于,根据以下任一项计算所述第一损失值:

6.如权利要求1所述的方法,其特征在于,所述根...

【专利技术属性】
技术研发人员:王雪周川吴鹏张福国李泽鹏李晓恩运红宇
申请(专利权)人:国家电投集团科学技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1