【技术实现步骤摘要】
一种基于改进的语义分割网络的实时图像检索方法
本专利技术涉及图像处理
,尤其涉及一种基于改进的语义分割网络的实时图像检索方法。
技术介绍
依据图像基本视觉特征,从数据库中查找出用户所需求图像的技术称为基于内容的图像检索(CBIR)。通常情况下,用户的需求是以查询图像的方式给定的。简单来讲,它需要通过对用户待查询图像的内容分析,提取合适的检索特征,将图像数据库中符合特征的图片检索得到结果。CBIR作为日常生活中的一项工程性需求,己经被广泛应用于百度,Google等检索网站,也被嵌入各种电商平台,例如京东、淘宝等。传统的图像检索方法使用手工设计的特征提取算子获得图像的低级视觉特征。低级视觉特征包括色彩、边缘、纹理、位置和几何形状等。常用的提取方法包括Gabor滤波器、SIFT算子、SURF算子等。但上述手工设计的特征算子不具有泛化能力,仅对于某一类别有较好的提取能力而对其他类别提取能力弱。图像检索需要处理上百种类别的图像故使用低级视觉特征提取算子存在很大的局限性(阮梦慧.基于卷积神经网络的图像检索若干关键技术研究[D].浙 ...
【技术保护点】
1.一种基于改进的语义分割网络的实时图像检索方法,其特征在于,包括以下步骤:/nS1、收集检索图像组成需要训练的数据集,并对数据集进行扩充,将扩充后的数据集分为训练集、测试集、验证集;/nS2、构建改进的实时计算的语义分割网络;/nS3、将训练集的图片输入改进的实时计算的语义分割网络,得到图片的语义向量,按照图片的类别信息存储语义向量,得到图像检索的语义向量数据库;/nS4、将测试集中待检测图片送入改进的实时计算的语义分割网络得到语义特征向量,比较待检索的图片的语义类别和图像检索语义向量数据库中向量的图像的类别信息是否一致,得到包含带检索图片语义类别的候选图片组;/nS5、 ...
【技术特征摘要】
1.一种基于改进的语义分割网络的实时图像检索方法,其特征在于,包括以下步骤:
S1、收集检索图像组成需要训练的数据集,并对数据集进行扩充,将扩充后的数据集分为训练集、测试集、验证集;
S2、构建改进的实时计算的语义分割网络;
S3、将训练集的图片输入改进的实时计算的语义分割网络,得到图片的语义向量,按照图片的类别信息存储语义向量,得到图像检索的语义向量数据库;
S4、将测试集中待检测图片送入改进的实时计算的语义分割网络得到语义特征向量,比较待检索的图片的语义类别和图像检索语义向量数据库中向量的图像的类别信息是否一致,得到包含带检索图片语义类别的候选图片组;
S5、将待检测图片的语义特征向量和候选图片组语义特征向量的进行匹配,得到最接近单位值的若干张图片即为检索结果。
2.根据权利要求1所述的一种基于改进的语义分割网络的实时图像检索方法,其特征在于,步骤S1是选取数据集PASCAL(PatternAnalysis,StatisticalModellingandComputationalLearning(模式分析,统计建模和计算学习)VOC(视觉对象类(VisualObjectClasses)2012和伯克利数据集合并构造扩充数据集。
3.根据权利要求2所述的一种基于改进的语义分割网络的实时图像检索方法,其特征在于,所述PSCALVOC2012数据集中共有二十一个类别,其中训练集、验证集、测试集的图像数目分别为M张、H张、R张,使用伯克利数据集进行扩充原数据集,最终得到训练图像、验证图像和测试图像。
4.根据权利要求3所述的一种基于改进的语义分割网络的实时图像检索方法,其特征在于,所述改进的实时计算的语义分割网络采用图像语义分割和实时检索深度学习网络框架;所述网络框架采用编码器-解码器结构,所述编码器的计算结果将用于对象特征信息向量的抽取,所述解码器将用于提取对象的类别信息。
5.根据权利要求4所述的一种基于改进的语义分割网络的实时图像检索方法,其特征在于,所述编码器的编码网络采用轻量化网络MobileNet(适用于移动视觉应用的高效卷积神经网络)EfficientConvolutionalNeuralNetworksforMobileVisionApplications)作为主干网络,并且在原网络的卷积层加入空洞卷积保持特征图的分辨率,同时选取带有邻近信息的空间金字塔池化模块(AtrousSpatialPyramidPooling,ASPP),在ASPP网络结构中加入全局平均池化模块和a*a...
【专利技术属性】
技术研发人员:王博,吴忻生,陈安,杨璞光,陈纯玉,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。