场景图像的处理方法、装置及系统制造方法及图纸

技术编号:21185185 阅读:30 留言:0更新日期:2019-05-22 15:48
本发明专利技术提供一种场景图像的处理方法、装置及系统,该方法包括:获取待检测的场景图像;将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;通过所述目标学生网络模型输出对应的场景分类结果。本发明专利技术可以减弱/消除场景图像中无关信息的影响,提高场景图像处理的精准度,还可以使目标学生网络模型获取不同领域场景图像的特征,具有更强的泛化能力。

Scene Image Processing Method, Device and System

The invention provides a scene image processing method, device and system, which includes: acquiring the scene image to be detected; taking the scene image to be detected as the input of the target student network model; in which the target student network model refers to a network that classifies the scene image according to the scene and object features in the scene image; and through the network described above. The target student network model outputs the corresponding scene classification results. The invention can weaken/eliminate the influence of irrelevant information in scene images, improve the accuracy of scene image processing, and enable target student network model to acquire the features of scene images in different fields, thus having stronger generalization ability.

【技术实现步骤摘要】
场景图像的处理方法、装置及系统
本专利技术涉及计算机视觉图像的
,尤其涉及一种场景图像的处理方法、装置及系统。
技术介绍
随着科技的飞速发展,深度学习在解决诸如图像识别、语音识别和自然语言处理等问题方面取得了出色的成就,在各类神经网络中卷积神经网络的研究最为深入,基于卷积神经网络的分类模型也已取得了非常出色的成果。目前,卷积神经网络能够获取原始图像的有效特征,直接从原始像素中经过极少的预处理,识别得到视觉上面的有效规律。然而,由于场景图像的类别在一定程度上不由全局特征决定,而是由关键区域或者主要物体特征决定,因此单纯利用经典卷积神经网络对场景图像进行分类、提取特征易受场景图像中无关信息的影响,造成场景图像分类的准确度不高。
技术实现思路
本专利技术提供一种场景图像的处理方法、装置及系统,以减弱/消除场景图像中无关信息的影响,提高场景图像处理的精准度,还可以使目标学生网络模型获取不同领域场景图像的特征,具有更强的泛化能力。第一方面,本专利技术实施例提供的一种场景图像的处理方法,包括:获取待检测的场景图像;将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;通过所述目标学生网络模型输出对应的场景分类结果。在一种可能的设计中,在将所述待检测的场景图像作为目标学生网络模型的输入之前,还包括:构建初始学生网络;其中,所述初始学生网络中包括:场景分类支路、物体检测支路、特征融合模块、分类模块;所述场景分类支路用于提取场景图像的场景特征;所述物体检测支路用于提取场景图像的物体特征;所述特征融合模块用于融合所述场景特征和物体特征,得到对应的融合特征;所述分类模块用于根据所述融合特征对所述场景图像进行分类;构建训练数据集,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型。在一种可能的设计中,所述构建训练数据集,包括:将场景图像分别输入多个场景教师模型,将场景教师模型作为特征提取器得到所述场景图像的场景特征;其中,所述场景教师模型是指:对场景图像进行场景特征提取,并将提取出场景特征进行选择融合,得到所述场景图像的融合特征,所述场景图像的融合特征作为场景图像的场景特征标签;将场景图像输入物体教师模型,将物体教师模型作为特征提取器得到所述场景图像的物体特征;其中,所述物体教师模型是指:对场景图像进行物体特征提取,所述场景图像的物体特征作为场景图像的物体特征标签;标注有场景类别标签、场景特征标签以及物体特征标签的场景图像的集合构成所述初始学生网络的训练数据集。在一种可能设计中,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型,包括:构建所述初始学生网络的损失函数;以所述场景教师模型得到的场景特征标签为目标结果,迭代训练所述初始学生网络的场景分类支路;以所述物体教师模型得到的物体特征标签为目标结果,迭代训练所述初始学生网络的物体检测支路;以所述场景类别标签为目标结果,迭代训练所述初始学生网络的分类模块,以使得场景分类支路、物体检测支路、分类模块的总损失函数的损失值收敛或小于预设阈值。第二方面,本专利技术实施例提供的一种场景图像的处理装置,包括:获取模块,用于获取待检测的场景图像;输入模块,用于将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;输出模块,用于通过所述目标学生网络模型输出对应的场景分类结果。在一种可能的设计中,还包括:构建模块,用于构建初始学生网络;其中,所述初始学生网络中包括:场景分类支路、物体检测支路、特征融合模块、分类模块;所述场景分类支路用于提取场景图像的场景特征;所述物体检测支路用于提取场景图像的物体特征;所述特征融合模块用于融合所述场景特征和物体特征,得到对应的融合特征;所述分类模块用于根据所述融合特征对所述场景图像进行分类;获得模块,用于构建训练数据集,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型。在一种可能的设计中,所述构建训练数据集,包括:将场景图像分别输入多个场景教师模型,将场景教师模型作为特征提取器得到所述场景图像的场景特征;其中,所述场景教师模型是指:对场景图像进行场景特征提取,并将提取出场景特征进行选择融合,得到所述场景图像的融合特征,所述场景图像的融合特征作为场景图像的场景特征标签;将场景图像输入物体教师模型,将物体教师模型作为特征提取器得到所述场景图像的物体特征;其中,所述物体教师模型是指:对场景图像进行物体特征提取,所述场景图像的物体特征作为场景图像的物体特征标签;标注有场景类别标签、场景特征标签以及物体特征标签的场景图像的集合构成所述初始学生网络的训练数据集。在一种可能的设计中,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型,包括:构建所述初始学生网络的损失函数;以所述场景教师模型得到的场景特征标签为目标结果,迭代训练所述初始学生网络的场景分类支路;以所述物体教师模型得到的物体特征标签为目标结果,迭代训练所述初始学生网络的物体检测支路;以所述场景类别标签为目标结果,迭代训练所述初始学生网络的分类模块,以使得场景分类支路、物体检测支路、分类模块的总损失函数的损失值收敛或小于预设阈值。第三方面,本专利技术实施例提供的一种场景图像的处理系统,包括:存储器和处理器,存储器中存储有所述处理器的可执行指令;其中所述处理器配置为经由执行所述可执行指令来执行第一方面任一项所述的场景图像的处理方法。第四方面,本专利技术实施例提供的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一项所述的场景图像的处理方法。本专利技术提供一种场景图像的处理方法、装置及系统,该方法包括:获取待检测的场景图像;将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;通过所述目标学生网络模型输出对应的场景分类结果。本专利技术可以减弱/消除场景图像中无关信息的影响,提高场景图像处理的精准度,还可以使目标学生网络模型获取不同领域场景图像的特征,具有更强的泛化能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1(a)为本专利技术一应用场景示意图一;图1(b)为本专利技术一应用场景示意图二;图2为本专利技术实施例一提供的场景图像的处理方法的流程图;图3为本专利技术实施例二提供的场景图像的处理方法的流程图;图4为本专利技术实施例二提供的场景图像的处理方法中初始学生网络的结构示意图;图5为本专利技术实施例二提供的场景图像的处理方法中得到目标学生网络模型的训练示意图;图6为本专利技术实施例三提供的场景图像的处理装置的结构示意图;图7为本专利技术实施例四提供的场景图像的处理装置的结构示意图;图8为本专利技术实施例五提供的场景图像的处理系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本文档来自技高网...

【技术保护点】
1.一种场景图像的处理方法,其特征在于,包括:获取待检测的场景图像;将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;通过所述目标学生网络模型输出对应的场景分类结果。

【技术特征摘要】
1.一种场景图像的处理方法,其特征在于,包括:获取待检测的场景图像;将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型是指:根据场景图像中的场景特征和物体特征,对场景图像进行分类的网络;通过所述目标学生网络模型输出对应的场景分类结果。2.根据权利要求1所述的方法,其特征在于,在将所述待检测的场景图像作为目标学生网络模型的输入之前,还包括:构建初始学生网络;其中,所述初始学生网络中包括:场景分类支路、物体检测支路、特征融合模块、分类模块;所述场景分类支路用于提取场景图像的场景特征;所述物体检测支路用于提取场景图像的物体特征;所述特征融合模块用于融合所述场景特征和物体特征,得到对应的融合特征;所述分类模块用于根据所述融合特征对所述场景图像进行分类;构建训练数据集,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型。3.根据权利要求2所述的方法,其特征在于,所述构建训练数据集,包括:将场景图像分别输入多个场景教师模型,将场景教师模型作为特征提取器得到所述场景图像的场景特征;其中,所述场景教师模型是指:对场景图像进行场景特征提取,并将提取出场景特征进行选择融合,得到所述场景图像的融合特征,所述场景图像的融合特征作为场景图像的场景特征标签;将场景图像输入物体教师模型,将物体教师模型作为特征提取器得到所述场景图像的物体特征;其中,所述物体教师模型是指:对场景图像进行物体特征提取,所述场景图像的物体特征作为场景图像的物体特征标签;标注有场景类别标签、场景特征标签以及物体特征标签的场景图像的集合构成所述初始学生网络的训练数据集。4.根据权利要求3所述的方法,其特征在于,通过所述训练数据集训练所述初始学生网络,得到目标学生网络模型,包括:构建所述初始学生网络的损失函数;以所述场景教师模型得到的场景特征标签为目标结果,迭代训练所述初始学生网络的场景分类支路;以所述物体教师模型得到的物体特征标签为目标结果,迭代训练所述初始学生网络的物体检测支路;以所述场景类别标签为目标结果,迭代训练所述初始学生网络的分类模块,以使得场景分类支路、物体检测支路、分类模块的总损失函数的损失值收敛或小于预设阈值。5.一种场景图像的处理装置,其特征在于,包括:获取模块,用于获取待检测的场景图像;输入模块,用于将所述待检测的场景图像作为目标学生网络模型的输入;其中,所述目标学生网络模型...

【专利技术属性】
技术研发人员:李甲张睿智付奎赵沁平
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1