场景增强模型的训练方法及场景增强方法技术

技术编号:36535045 阅读:10 留言:0更新日期:2023-02-01 16:19
本公开提供了一种场景增强模型的训练方法及场景增强方法,涉及人工智能领域,具体涉及计算机视觉、图像处理和深度学习技术领域,具体实现方案为:对样本图像进行场景增强处理,以获取样本图像对应的第一场景增强图像;基于样本图像的场景增强参数与样本图像,对初始的场景增强模型进行训练,得到第一场景增强模型;得到样本图像对应的第二场景增强图像;调整第一场景增强模型的模型参数,并使用下一样本图像和下一样本图像的场景增强参数对调整后的第一场景增强模型进行继续训练,直至训练结束得到第二场景增强模型。由此,本公开能够在模型训练之前,预先对样本图像进行处理,以获取高质量的监督数据,提高了模型训练过程中的准确性和可靠性。中的准确性和可靠性。中的准确性和可靠性。

【技术实现步骤摘要】
场景增强模型的训练方法及场景增强方法


[0001]本公开涉及计算机
,并且更具体地涉及人工智能领域,具体涉及计算机视觉、图像处理和深度学习技术。

技术介绍

[0002]相关技术中,当进行场景增强时,通常会采用基于传统的图像增强方法,如采用边界约束和上下文正则化算法,然而基于上述方法往往存在场景增强效果欠佳等技术问题。因此,如何通过训练得到收敛的场景增强模型,并基于场景增强模型高效、准确地进行场景增强,已成为重要的研究方向之一。

技术实现思路

[0003]本公开提供了一种场景增强模型的训练方法及场景增强方法。
[0004]根据本公开的一方面,提供了一种场景增强模型的训练方法,包括:对样本图像进行场景增强处理,以获取所述样本图像对应的第一场景增强图像;基于所述样本图像的场景增强参数与所述样本图像,对初始的场景增强模型进行训练,得到第一场景增强模型;将所述样本图像输入至所述第一场景增强模型中,得到所述样本图像对应的第二场景增强图像;根据所述第一场景增强图像和所述第二场景增强图像,调整所述第一场景增强模型的模型参数,并使用下一样本图像和所述下一样本图像的场景增强参数对调整后的所述第一场景增强模型进行继续训练,直至训练结束得到第二场景增强模型。
[0005]根据本公开的另一方面,提供了一种场景增强方法,包括:获取待处理图像;将所述待处理图像输入至第二场景增强模型中,以输出所述待处理图像对应的场景增强图像,其中,所述第二场景增强模型为采用如第一方面所述的方法训练出的场景增强模型。
[0006]根据本公开的另一方面,提供了一种场景增强模型的训练装置,包括:
[0007]处理模块,用于对样本图像进行场景增强处理,以获取所述样本图像对应的第一场景增强图像;
[0008]训练模块,用于基于所述样本图像的场景增强参数与所述样本图像,对初始的场景增强模型进行训练,得到第一场景增强模型;
[0009]输入模块,用于将所述样本图像输入至所述第一场景增强模型中,得到所述样本图像对应的第二场景增强图像;
[0010]调整模块,用于根据所述第一场景增强图像和所述第二场景增强图像,调整所述第一场景增强模型的模型参数,并使用下一样本图像和所述下一样本图像的场景增强参数对调整后的所述第一场景增强模型进行继续训练,直至训练结束得到第二场景增强模型。
[0011]根据本公开的另一方面,提供了一种场景增强装置,包括:
[0012]获取模块,用于获取待处理图像;
[0013]输出模块,用于将所述待处理图像输入至第二场景增强模型中,以输出所述待处理图像对应的场景增强图像,其中,所述第二场景增强模型为采用如第一方面所述的方法
训练出的场景增强模型。
[0014]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的场景增强模型的训练方法或者第二方面所述的场景增强方法。
[0015]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开第一方面所述的场景增强模型的训练方法或者第二方面所述的场景增强方法。
[0016]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现根据本公开第一方面所述的场景增强模型的训练方法或者第二方面所述的场景增强方法。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0017]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0018]图1是根据本公开第一实施例的示意图;
[0019]图2是根据本公开第二实施例的示意图;
[0020]图3是根据本公开第三实施例的示意图;
[0021]图4是根据本公开第四实施例的示意图;
[0022]图5是根据本公开第五实施例的示意图;
[0023]图6是根据本公开第六实施例的示意图;
[0024]图7是一种场景增强模型训练过程的示意图;
[0025]图8是根据本公开第七实施例的示意图;
[0026]图9是一种获取场景增强图像过程的示意图;
[0027]图10是用来实现本公开实施例的场景增强模型的训练方法的场景增强模型的训练装置的框图;
[0028]图11是用来实现本公开实施例的场景增强方法的场景增强装置的框图;
[0029]图12是用来实现本公开实施例的场景增强模型的训练方法以及场景增强方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]以下对本公开的方案涉及的
进行简要说明:
[0032]计算机技术(Computer Technology),内容非常广泛,可粗略分为计算机系统技术、计算机器件技术、计算机部件技术和计算机组装技术等几个方面。计算机技术包括:运
算方法的基本原理与运算器设计、指令系统、中央处理器(CPU)设计、流水线原理及其在CPU设计中的应用、存储体系、总线与输入输出。
[0033]AI(Artificial Intelligence,人工智能),是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。
[0034]计算机视觉(Computer Vision,CV),是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
[0035]图像处理技术(Image Processing),图像处理技术是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。
[0036]DL(Deep Learning,深度学习),是ML机器学习(Machine Learning,机器学习)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在律和表示层次,这些学习过程中获得的信息对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场景增强模型的训练方法,包括:对样本图像进行场景增强处理,以获取所述样本图像对应的第一场景增强图像;基于所述样本图像的场景增强参数与所述样本图像,对初始的场景增强模型进行训练,得到第一场景增强模型;将所述样本图像输入至所述第一场景增强模型中,得到所述样本图像对应的第二场景增强图像;根据所述第一场景增强图像和所述第二场景增强图像,调整所述第一场景增强模型的模型参数,并使用下一样本图像和所述下一样本图像的场景增强参数对调整后的所述第一场景增强模型进行继续训练,直至训练结束得到第二场景增强模型。2.根据权利要求1所述的训练方法,其中,所述对样本图像进行场景增强处理之前,还包括:获取样本视频,并对所述样本视频进行场景识别,以获取所述样本视频对应的至少一个场景;按照识别出的所述至少一个场景,对所述样本视频中的帧图像进行场景划分,获取每个场景的帧图像集合,作为所述场景的样本图像。3.根据权利要求2所述的训练方法,其中,所述按照识别出的所述至少一个场景,对所述样本视频中的帧图像进行场景划分,获取每个场景的帧图像集合,包括:针对每个场景,获取每个帧图像上的场景识别框的标识信息;基于所述场景识别框的标识信息,对所述样本视频中的帧图像进行场景划分,得到所述场景的帧图像集合。4.根据权利要求1所述的训练方法,其中,所述方法还包括:获取每个场景的场景增强参数;根据所述场景增强参数,对每个场景下的所有所述样本图像进行场景增强处理,以获取每个所述样本图像的第一场景增强图像。5.根据权利要求4所述的训练方法,其中,所述方法还包括:识别每个场景的类型;根据所述场景的类型,确定所述场景的场景增强参数。6.根据权利要求4所述的训练方法,其中,所述方法还包括:获取样本视频中前M帧图像的图像参数和所述M帧图像各自对应的场景,所述M为正整数;获取属于同一场景的所述图像参数;根据属于同一场景的所述图像参数,确定所述同一场景的场景增强参数。7.根据权利要求1

6中任一项所述的训练方法,其中,所述根据所述第一场景增强图像和所述第二场景增强图像,调整所述第一场景增强模型的模型参数,包括:获取所述第一场景增强图像和所述第二场景增强图像之间的场景相似度;根据所述场景相似度获取损失函数;根据所述损失函数,调整所述第一场景增强模型的模型参数。8.根据权利要求7所述的训练方法,其中,所述根据所述场景相似度获取损失函数,包括:
将所述场景相似度与预设的场景相似度阈值进行比较;在所述场景相似度小于所述场景相似度阈值的情况下,根据所述场景相似度获取所述损失函数。9.一种场景增强方法,包括:获取待处理图像;将所述待处理图像输入至第二场景增强模型中,以输出所述待处理图像对应的场景增强图像,其中,所述第二场景增强模型为采用如权利要求1

9中任一项所述的方法训练出的场景增强模型。10.一种场景增强模型的训练装置,包括:处理模块,用于对样本图像进行场景增强处理,以获取所述样本图像对应的第一场景增强图像;训练模块,用于基于所述样本图像的场景增强参数与所述样本图像,对初始的场景增强模型进行训练,得到第一场景增强模型;输入模块...

【专利技术属性】
技术研发人员:张琦李旭莉李雪
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1