System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像语义分割模型的训练方法、装置、计算机设备和存储介质制造方法及图纸_技高网

图像语义分割模型的训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:41263411 阅读:3 留言:0更新日期:2024-05-11 09:20
本发明专利技术涉及一种图像语义分割模型的训练方法方法、装置、计算机设备和存储介质,方法包括:获取训练图像训练集;将训练图像训练集中的训练图像分批次输入待训练图像语义分割模型的编码模块,编码模块输出各批次训练图像的高阶特征;根据当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对当前批次的高阶进行增强处理;将增强后的当前批次的高阶特征输入待训练图像语义分割模型的解码模块,解码模块输出当前批次的训练图像的语义分割结果;根据语义分割结果,对待训练图像语义分割模型进行训练。上述方法可以提高对测试图像集的测试准确性。

【技术实现步骤摘要】

本专利技术涉及机器学习,尤其涉及一种图像语义分割模型的训练方法、装置、计算机设备和存储介质


技术介绍

1、语义分割作为深度学习和机器学习下辖子任务之一,在自动驾驶、医学疾病检测等领域具有重要应用场景,是计算机视觉识别任务中的一个重要研究课题。图像语义分割是在像素级别上进行分类,属于同一类的像素都要被归为一类。例如,如果在一张照片中,属于摩托车的像素被划分为一类,除此之外所有属于背景的像素也被划分为一类。因此该问题需要捕获像素之间的差异,充分挖掘像素之间的判别性特征和语义关系。

2、图像语义分割图像识别主要存在以下三个方面的问题:(1)图像的场景模式和背景环境复杂,像素点间关系紧密,难以学习到有判别力的特征和语义关系。(2)图像的标签需要人工逐像素手动标注,导致构造大型训练数据库费时费力。(3)需要识别的类别数过多,使得很难分辨出某些不寻常类别。

3、现有的方法主要通过以下三个方面达到逐像素识别的目的:(1)基于滑动窗口的网络进行逐像素识别与分割。(2)先通过编码器结构学习判别力特征,再通过解码器解耦。(3)引入高分辨率信息,结合全局特征与局部特征实现语义分割。


技术实现思路

1、本专利技术提供一种图像语义分割模型的训练方法、装置、计算机设备和存储介质。

2、第一方面,提供了一种图像语义分割模型的训练方法,所述训练方法包括:

3、获取训练图像训练集,所述训练图像训练集中的训练图像包含标注信息;

4、将所述训练图像训练集中的所述训练图像分批次输入待训练图像语义分割模型的编码模块,所述编码模块输出各批次训练图像的高阶特征;

5、确定所述编码模块输出的高阶特征的数量达到第一预设数量时,对所述编码模块输出的当前批次的高阶特征进行增强处理,其中,根据所述当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理;

6、将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块,所述解码模块输出当前批次的训练图像的语义分割结果;

7、根据所述语义分割结果,对所述待训练图像语义分割模型进行训练。

8、在一些实施例中,所述待训练图像语义分割模型还包括上下文注意力模块,所述根据所述当前批次的高阶与所述当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理,包括:

9、通过所述上下文注意力模块计算当前批次的各训练图像的各像素点的高阶特征与所述当前批次之前的各训练图像的各像素点的高阶特征的语义关系权重;

10、根据所述语义关系权重,通过加权和对当前批次的所述训练图像的各像素点高阶进行增强处理,得到所述训练图像的增强高阶特征。

11、在一些实施例中,在所述根据所述语义关系权重,通过加权和对当前批次的所述训练图像的各像素点高阶进行增强处理之后,所述将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块之前,还包括:

12、将所述训练图像的增强高阶特征和所述训练图像的高阶特征进行融合,得到融合高阶特征;

13、所述将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块,包括:

14、将当前批次的所述训练图像的所述融合高阶特征输入所述待训练图像语义分割模型的解码模块。

15、在一些实施例中,所述方法还包括:将所述编码模块输出各批次训练图像的高阶特征输入特征记忆模块进行存储。

16、在一些实施例中,所述特征记忆模块是队列存储结构,所述训练图像的高阶特征在所述特征记忆模块中按照所述高阶特征的输出时间由前至后排序;

17、所述根据所述当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理,包括:

18、选择排在特征记忆模块末端的所述第二预设数量的高阶特征作为目标高阶特征;

19、根据所述当前批次的高阶与所述目标高阶特征的语义关系对所述当前批次的高阶进行增强处理。

20、在一些实施例中,所述根据所述语义分割结果,对所述待训练图像语义分割模型进行训练,包括:

21、所述解码器包括多个卷积层,各卷积层分别输出各自对应的语义分割结果;

22、根据所有卷积层输出的语义分割结果对所述待训练图像语义分割模型进行训练。

23、在一些实施例中,所述根据所有卷积层输出的语义分割结果对所述待训练图像语义分割模型进行训练,包括:

24、计算各卷积层输出的语义分割结果与训练图像的标注信息之间的交叉熵损失函数;

25、根据所有所有卷积层对应的交叉熵损失函数之和对所述待训练图像语义分割模型进行训练。

26、第二方面,提供了一种图像语义分割模型的训练装置,包括:

27、获取单元,获取训练图像训练集,所述训练图像训练集中的训练图像包含标注信息;

28、编码单元,用于将所述训练图像训练集中的所述训练图像分批次输入待训练图像语义分割模型的编码模块,所述编码模块输出各批次训练图像的高阶特征;

29、增强单元,用于确定所述编码模块输出的高阶特征的数量达到第一预设数量时,对所述编码模块输出的当前批次的高阶特征进行增强处理,其中,根据所述当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理;

30、解码单元,用于将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块,所述解码模块输出当前批次的训练图像的语义分割结果;

31、训练单元,用于根据所述语义分割结果,对所述待训练图像语义分割模型进行训练。

32、第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述图像语义分割模型的训练方法的步骤。

33、第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述图像语义分割模型的训练方法的步骤。

34、上述图像语义分割模型的训练方法、装置、计算机设备及存储介质所实现的方案中,可以通过获取训练图像训练集,训练图像训练集中的训练图像包含标注信息;将训练图像训练集中的训练图像分批次输入待训练图像语义分割模型的编码模块,编码模块输出各批次训练图像的高阶特征;确定编码模块输出的高阶特征的数量达到第一预设数量时,对编码模块输出的当前批次的高阶特征进行增强处理,其中,根据当前批次的高阶与当前批次之前的第二预设数量的高阶特征的语义关系对当前批次的高阶进行增强处理;将增强后的当前批次的高阶特征输入待训练图像语义分割模型的解码模块,解码模块输出当前批次的训练图像的语义分割结果;根据语义分割结果,对待训练图像语义分割模型进行训练,在本专利技术中,综合考虑了图像语义分割类间关系复杂,需要基于物体的区域特征本文档来自技高网...

【技术保护点】

1.一种图像语义分割模型的训练方法,其特征在于,所述训练方法包括:

2.如权利要求1所述的图像语义分割模型的训练方法,其特征在于,所述待训练图像语义分割模型还包括上下文注意力模块,所述根据所述当前批次的高阶与所述当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理,包括:

3.如权利要求2所述的图像语义分割模型的训练方法,其特征在于,在所述根据所述语义关系权重,通过加权和对当前批次的所述训练图像的各像素点高阶进行增强处理之后,所述将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块之前,还包括:

4.如权利要求1所述的图像语义分割模型的训练方法,其特征在于,所述方法还包括:将所述编码模块输出各批次训练图像的高阶特征输入特征记忆模块进行存储。

5.如权利要求4所述的图像语义分割模型的训练方法,其特征在于,所述特征记忆模块是队列存储结构,所述训练图像的高阶特征在所述特征记忆模块中按照所述高阶特征的输出时间由前至后排序;

6.如权利要求1所述的图像语义分割模型的训练方法,其特征在于,所述根据所述语义分割结果,对所述待训练图像语义分割模型进行训练,包括:

7.如权利要求6所述的图像语义分割模型的训练方法,其特征在于,所述根据所有卷积层输出的语义分割结果对所述待训练图像语义分割模型进行训练,包括:

8.一种图像语义分割模型的训练装置,其特征在于,所述训练装置包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述图像语义分割模型的训练方法的步骤。

10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述图像语义分割模型的训练方法的步骤。

...

【技术特征摘要】

1.一种图像语义分割模型的训练方法,其特征在于,所述训练方法包括:

2.如权利要求1所述的图像语义分割模型的训练方法,其特征在于,所述待训练图像语义分割模型还包括上下文注意力模块,所述根据所述当前批次的高阶与所述当前批次之前的第二预设数量的高阶特征的语义关系对所述当前批次的高阶进行增强处理,包括:

3.如权利要求2所述的图像语义分割模型的训练方法,其特征在于,在所述根据所述语义关系权重,通过加权和对当前批次的所述训练图像的各像素点高阶进行增强处理之后,所述将增强后的当前批次的高阶特征输入所述待训练图像语义分割模型的解码模块之前,还包括:

4.如权利要求1所述的图像语义分割模型的训练方法,其特征在于,所述方法还包括:将所述编码模块输出各批次训练图像的高阶特征输入特征记忆模块进行存储。

5.如权利要求4所述的图像语义分割模型的训练方法,其特征在于,所述特征记忆模块是队列存储结构,所述训练图像的高阶特...

【专利技术属性】
技术研发人员:梁孔明尹子进马占宇
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1