一种基于内容的图像预处理方法及系统技术方案

技术编号:19747367 阅读:24 留言:0更新日期:2018-12-12 05:06
本发明专利技术公开了一种基于内容的图像预处理方法及系统,该方法包括步骤:S1.获取原始图像集;S2.对所述原始图像集中的图像进行感兴趣物体选择;S3.对感兴趣物体选择后的图像进行物体分割;S4.根据物体分割后的结果生成新的图像集。本发明专利技术通过结合感兴趣物体选择与物体分割完成对原始图像训练集的预处理,进而基于图像的语义内容获得一个具有与原始图像集不同分布的新的图像集,可为不同的图像识别分类策略提供相应的数据资源。

【技术实现步骤摘要】
一种基于内容的图像预处理方法及系统
本专利技术涉及图像处理
,尤其涉及一种基于内容的图像预处理方法及系统。
技术介绍
图像预处理方法为图像数据增广(dataaugmentation)提供了重要的基础技术。数据增广则在图像分类识别的训练任务中起到了非常重要的作用,原因在于对一个有监督的学习任务来说对训练数据进行人工标注的成本相对是比较高的。因此,如何基于少量的标注数据利用不同的图像预处理方法生成更多的可用于训练的数据,进而提高训练的模型的识别性能和泛化能力,是一个非常有意义的问题。现有的用于数据增广的图像预处理方法一般有以下几种:(1)ColorJittering:对图像亮度、饱和度、对比度进行变化;(2)PCAJittering:首先按照RGB三个颜色通道计算均值和标准差,再在整个训练集上计算协方差矩阵,进行特征分解,得到特征向量和特征值,用来做PCAJittering;(3)RandomScale:尺度变换;(4)RandomCrop:采用随机图像差值方式,对图像进行裁剪、缩放;包括ScaleJittering方法(VGG及ResNet模型使用)或者尺度和长宽比增强变换;(5)Horizontal/VerticalFlip:水平/垂直翻转;(6)Shift:平移变换;(7)Rotation/Reflection:旋转/仿射变换;(8)Noise:高斯噪声、模糊处理;(9)Labelshuffle:类别不平衡数据的增广。虽然上述的集中用于数据增广的图像预处理方法可以在一个具体的图像分析相关任务中起到非常积极的作用,但是这些方法均是居于全局图像(图像的标注label语义信息)来完成,一般处理后得到的增广数据是与原始数据加在一起用于训练一个模型的,这使得模型并不能够有效的对图像中的局部语义内容进行学习,进而限制了为不同的图像识别分类策略提供相应的数据资源。公开号为CN105740876A的专利公开了一种图像预处理方法及装置,该方法采集原始图像,根据原始图像的像素位置信息和像素灰度值信息,对原始图像进行滤波处理,生成滤波图像,然后根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像,再根据所述增强图像,生成类梯度图,并对所述类梯度图进行二值化处理,生成二值图像。虽然通过上述方法,由于对原始图像进行了以上的预处理操作,在抑制图像噪声的同时,增强了原始图像中包含的文字信息的清晰度和对比度,在后续可对预处理后的二值图像中包含的文字信息进行图像识别,提高了识别正确率。但是该图像预处理方法还是居于全局图像来完成,处理后的图像是增广数据是与原始数据加在一起用于训练一个模型的,限制了为不同的图像识别分类策略提供相应的数据资源。
技术实现思路
本专利技术的目的是针对现有技术的缺陷,提供了一种基于内容的图像预处理方法及系统,通过结合感兴趣物体选择与物体分割完成对原始图像训练集的预处理,进而基于图像的内容获得一个具有与原始数据不同分布的新的数据集,为不同的图像识别分类策略提供相应的数据资源。为了实现以上目的,本专利技术采用以下技术方案:一种基于内容的图像预处理方法,包括步骤:S1.获取原始图像集;S2.对所述原始图像集中的图像进行感兴趣物体选择;S3.对感兴趣物体选择后的图像进行物体分割;S4.根据物体分割后的结果生成新的图像集。进一步的,所述对所述原始图像集中的图像进行感兴趣物体选择的具体过程为:S201.获取图像中的物体区域;S202.根据物体感兴趣度量模型计算出图像中每个物体的感兴趣程度;S203.根据所述图像中每个物体的感兴趣程度选择图像中感兴趣物体。进一步的,所述物体感兴趣度量模型是通过融合物体多几何信息得到的;所述物体多几何信息包括物体的面积信息和位置信息。进一步的,建立所述物体感兴趣度量模型具体过程为:S2101.建立基于物体面积信息的感兴趣程度度量模型;S2102.建立基于物体位置信息的感兴趣程度度量模型;S2103.融合所述基于物体面积信息的感兴趣程度度量模型和所述基于物体位置信息的感兴趣程度度量模型。进一步的,所述对感兴趣物体选择后的图像进行物体分割具体过程为:S301.对感兴趣物体选择后的图像进行Grabcut物体分割;S302.对Grabcut物体分割后的图像进行掩膜处理;S303.对掩膜处理后的图像进行形态学闭运算处理;S304.查找形态学闭运算处理后图像中的最大连通区域;S305.根据所述最大连通区域提取所述Grabcut物体分割后的图像中的物体区域。相应的,还提供一种基于内容的图像预处理系统,包括:获取模块,用于获取原始图像集;感兴趣物体选择模块,用于对所述原始图像集中的图像进行感兴趣物体选择;物体分割模块,用于对感兴趣物体选择后的图像进行物体分割;新图像集生成模块,用于根据物体分割后的结果生成新的图像集。进一步的,所述对所述原始图像集中的图像进行感兴趣物体选择的具体过程为:S201.获取图像中的物体区域;S202.根据物体感兴趣度量模型计算出图像中每个物体的感兴趣程度;S203.根据所述图像中每个物体的感兴趣程度选择图像中感兴趣物体。进一步的,所述物体感兴趣度量模型是通过融合物体多几何信息得到的;所述物体多几何信息包括物体的面积信息和位置信息。进一步的,建立所述物体感兴趣度量模型具体过程为:S2101.建立基于物体面积信息的感兴趣程度度量模型;S2102.建立基于物体位置信息的感兴趣程度度量模型;S2103.融合所述基于物体面积信息的感兴趣程度度量模型和所述基于物体位置信息的感兴趣程度度量模型。进一步的,所述对感兴趣物体选择后的图像进行物体分割具体过程为:S301.对感兴趣物体选择后的图像进行Grabcut物体分割;S302.对Grabcut物体分割后的图像进行掩膜处理;S303.对掩膜处理后的图像进行形态学闭运算处理;S304.查找形态学闭运算处理后图像中的最大连通区域;S305.根据所述最大连通区域提取所述Grabcut物体分割后的图像中的物体区域。与现有技术相比,本专利技术通过结合感兴趣物体选择与物体分割完成对原始图像训练集的预处理,进而基于图像的语义内容获得一个具有与原始图像集不同分布的新的图像集,可为不同的图像识别分类策略提供相应的数据资源。附图说明图1为本专利技术提供的一种基于内容的图像预处理方法流程图;图2为本专利技术部分图片获取图像中的物体区域的结果图;图3为本专利技术部分图片感兴趣物体选择结果图;图4为本专利技术部分图片进行物体分割后的结果图;图5为本专利技术的原图像集;图6为本专利技术生成的新图像集;图7为本专利技术提供的一种基于内容的图像预处理系统结构图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数本文档来自技高网
...

【技术保护点】
1.一种基于内容的图像预处理方法,其特征在于,包括步骤:S1.获取原始图像集;S2.对所述原始图像集中的图像进行感兴趣物体选择;S3.对感兴趣物体选择后的图像进行物体分割;S4.根据物体分割后的结果生成新的图像集。

【技术特征摘要】
1.一种基于内容的图像预处理方法,其特征在于,包括步骤:S1.获取原始图像集;S2.对所述原始图像集中的图像进行感兴趣物体选择;S3.对感兴趣物体选择后的图像进行物体分割;S4.根据物体分割后的结果生成新的图像集。2.根据权利要求1所述的一种基于内容的图像预处理方法,其特征在于,所述对所述原始图像集中的图像进行感兴趣物体选择的具体过程为:S201.获取图像中的物体区域;S202.根据物体感兴趣度量模型计算出图像中每个物体的感兴趣程度;S203.根据所述图像中每个物体的感兴趣程度选择图像中感兴趣物体。3.根据权利要求2所述的一种基于内容的图像预处理方法,其特征在于,所述物体感兴趣度量模型是通过融合物体多几何信息得到的;所述物体多几何信息包括物体的面积信息和位置信息。4.根据权利要求3所述的一种基于内容的图像预处理方法,其特征在于,建立所述物体感兴趣度量模型具体过程为:S2101.建立基于物体面积信息的感兴趣程度度量模型;S2102.建立基于物体位置信息的感兴趣程度度量模型;S2103.融合所述基于物体面积信息的感兴趣程度度量模型和所述基于物体位置信息的感兴趣程度度量模型。5.根据权利要求1所述的一种基于内容的图像预处理方法,其特征在于,所述对感兴趣物体选择后的图像进行物体分割具体过程为:S301.对感兴趣物体选择后的图像进行Grabcut物体分割;S302.对Grabcut物体分割后的图像进行掩膜处理;S303.对掩膜处理后的图像进行形态学闭运算处理;S304.查找形态学闭运算处理后图像中的最大连通区域;S305.根据所述最大连通区域提取所述Grabcut物体分割后的图像中的物体区域。6.一种基于内容的图像预处...

【专利技术属性】
技术研发人员:杨永全
申请(专利权)人:四川斐讯信息技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1