场景图像的处理方法、装置及系统制造方法及图纸

技术编号：21185185 阅读：30 留言：0更新日期：2019-05-22 15:48

本发明专利技术提供一种场景图像的处理方法、装置及系统，该方法包括：获取待检测的场景图像；将所述待检测的场景图像作为目标学生网络模型的输入；其中，所述目标学生网络模型是指：根据场景图像中的场景特征和物体特征，对场景图像进行分类的网络；通过所述目标学生网络模型输出对应的场景分类结果。本发明专利技术可以减弱/消除场景图像中无关信息的影响，提高场景图像处理的精准度，还可以使目标学生网络模型获取不同领域场景图像的特征，具有更强的泛化能力。

Scene Image Processing Method, Device and System

The invention provides a scene image processing method, device and system, which includes: acquiring the scene image to be detected; taking the scene image to be detected as the input of the target student network model; in which the target student network model refers to a network that classifies the scene image according to the scene and object features in the scene image; and through the network described above. The target student network model outputs the corresponding scene classification results. The invention can weaken/eliminate the influence of irrelevant information in scene images, improve the accuracy of scene image processing, and enable target student network model to acquire the features of scene images in different fields, thus having stronger generalization ability.

全部详细技术资料下载

【技术实现步骤摘要】
场景图像的处理方法、装置及系统
本专利技术涉及计算机视觉图像的
，尤其涉及一种场景图像的处理方法、装置及系统。
技术介绍
随着科技的飞速发展，深度学习在解决诸如图像识别、语音识别和自然语言处理等问题方面取得了出色的成就，在各类神经网络中卷积神经网络的研究最为深入，基于卷积神经网络的分类模型也已取得了非常出色的成果。目前，卷积神经网络能够获取原始图像的有效特征，直接从原始像素中经过极少的预处理，识别得到视觉上面的有效规律。然而，由于场景图像的类别在一定程度上不由全局特征决定，而是由关键区域或者主要物体特征决定，因此单纯利用经典卷积神经网络对场景图像进行分类、提取特征易受场景图像中无关信息的影响，造成场景图像分类的准确度不高。
技术实现思路
本专利技术提供一种场景图像的处理方法、装置及系统，以减弱/消除场景图像中无关信息的影响，提高场景图像处理的精准度，还可以使目标学生网络模型获取不同领域场景图像的特征，具有更强的泛化能力。第一方面，本专利技术实施例提供的一种场景图像的处理方法，包括：获取待检测的场景图像；将所述待检测的场景图像作为目标学生网络模型的输入；其中，所述目标学生网络模型是指：根据场景图像中的场景特征和物体特征，对场景图像进行分类的网络；通过所述目标学生网络模型输出对应的场景分类结果。在一种可能的设计中，在将所述待检测的场景图像作为目标学生网络模型的输入之前，还包括：构建初始学生网络；其中，所述初始学生网络中包括：场景分类支路、物体检测支路、特征融合模块、分类模块；所述场景分类支路用于提取场景图像的场景特征；所述物体检测支路用于提取场景图像的物体特...

【技术保护点】
1.一种场景图像的处理方法，其特征在于，包括：获取待检测的场景图像；将所述待检测的场景图像作为目标学生网络模型的输入；其中，所述目标学生网络模型是指：根据场景图像中的场景特征和物体特征，对场景图像进行分类的网络；通过所述目标学生网络模型输出对应的场景分类结果。

【技术特征摘要】
1.一种场景图像的处理方法，其特征在于，包括：获取待检测的场景图像；将所述待检测的场景图像作为目标学生网络模型的输入；其中，所述目标学生网络模型是指：根据场景图像中的场景特征和物体特征，对场景图像进行分类的网络；通过所述目标学生网络模型输出对应的场景分类结果。2.根据权利要求1所述的方法，其特征在于，在将所述待检测的场景图像作为目标学生网络模型的输入之前，还包括：构建初始学生网络；其中，所述初始学生网络中包括：场景分类支路、物体检测支路、特征融合模块、分类模块；所述场景分类支路用于提取场景图像的场景特征；所述物体检测支路用于提取场景图像的物体特征；所述特征融合模块用于融合所述场景特征和物体特征，得到对应的融合特征；所述分类模块用于根据所述融合特征对所述场景图像进行分类；构建训练数据集，通过所述训练数据集训练所述初始学生网络，得到目标学生网络模型。3.根据权利要求2所述的方法，其特征在于，所述构建训练数据集，包括：将场景图像分别输入多个场景教师模型，将场景教师模型作为特征提取器得到所述场景图像的场景特征；其中，所述场景教师模型是指：对场景图像进行场景特征提取，并将提取出场景特征进行选择融合，得到所述场景图像的融合特征，所述场景图像的融合特征作为场景图像的场景特征标签；将场景图像输入物体教师模型，将物体教师模型作为特征提取器得到所述场景图像的物体特征；其中，所述物体教师模型是指：对场景图像进行物体特征提取，所述场景图像的物体特征作为场景图像的物体特征标签；标注有场景类别标签、场景特征标签以及物体特征标签的场景图像的集合构成所述初始学生网络的训练数据集。4.根据权利要求3所述的方法，其特征在于，通过所述训练数据集训练所述初始学生网络，得到目标学生网络模型，包括：构建所述初始学生网络的损失函数；以所述场景教师模型得到的场景特征标签为目标结果，迭代训练所述初始学生网络的场景分类支路；以所述物体教师模型得到的物体特征标签为目标结果，迭代训练所述初始学生网络的物体检测支路；以所述场景类别标签为目标结果，迭代训练所述初始学生网络的分类模块，以使得场景分类支路、物体检测支路、分类模块的总损失函数的损失值收敛或小于预设阈值。5.一种场景图像的处理装置，其特征在于，包括：获取模块，用于获取待检测的场景图像；输入模块，用于将所述待检测的场景图像作为目标学生网络模型的输入；其中，所述目标学生网络模型...

【专利技术属性】
技术研发人员：李甲，张睿智，付奎，赵沁平，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人