基于图像特征的图像主体的识别方法技术

技术编号:16128797 阅读:33 留言:0更新日期:2017-09-01 20:50
本发明专利技术公开了一种基于图像特征的图像主体的识别方法。该方法首先进行图像的初步处理,通过图片增强深化图片特征,将前景和背景大致区分开;形态学处理主要用于提取图像特征,分割过程则将一幅图像划分为组成部分或目标对象;研究图像特征提取则是要将前面提取出来的图像元素或目标对象表示为适合计算机后续处理的数值形式,最终形成能够直接供机器学习生成的分类器模型使用的特征;分布式环境提供搜索效率和并行计算能力;输入图像经过上述方法识别得到特征数据后搜索与之相似度最高的图像并输出,判断二者是否匹配。本发明专利技术不仅提供了稳定可行的图像搜索方法,对图像的语义进行深度的分析学习,提高了当前搜索算法的时间和速度,同时避免了网络制约,普适性很高。

Image main body recognition method based on image characteristics

The invention discloses an image main body recognition method based on image characteristics. The preliminary processing method first image, further enhancing the image features through the picture, separate the foreground and background are area; morphological processing is mainly used for image feature extraction, segmentation is to partition an image into components or objects; image feature extraction is to image elements or objects in front of the extracted expressed as a numerical form suitable for subsequent computer processing, and ultimately the formation of features used for machine learning classifier model can directly generate the distributed environment; provide the search efficiency and parallel computing ability; the input image by the method identified feature data after image search and output the most similar, judge whether the two match. The invention not only provides a stable and feasible method of image search, analysis of learning depth on the semantics of images, improve the search time and speed, while avoiding the network constraints, the universality is very high.

【技术实现步骤摘要】
基于图像特征的图像主体的识别方法
本专利技术涉及如何提取图像隐藏信息完成大型图像库的分类后进行高效识别,并将结果输出以供使用的方法,特别是一种基于图像特征的图像主体的识别方法。在提高检索效率方面做出了非常大的进步提升,故应用前景广泛。
技术介绍
基于图像特征的图像主体的识别方法是指仅需消费者提供所需物品的图片,便可通过本方法获得改物品的特征信息。随着WWW的急剧增长以及多媒体技术的飞速发展,快速有效地进行互联网图片信息检索、查询和浏览,成为人们的迫切需求。目前,一些现存的方法的图片搜索方法,大多是采用基于文本关键字和链接信息来进行图片的搜索和检索,并没有利用图片本身的视觉内容信息,其检索精确度受到一定的限制。而一些基于内容的图片检索系统则仅仅利用图片的内容信息来进行图片检索,难于解决语义鸿沟的问题。如果用户手上有一张图片,用以上方法查询这张图片的内部信息显然很不方便,因为一般来说,图片搜索只是分析同关键词有关的网络图片,而图片的内容因为多种原因不会被纳入到搜索的范畴里,例如在搜图网站上搜索一个用户感兴趣的物品,用户手上有它的照片,但是不知道它的具体信息如图片所描述的对象的种类,那就无从下手进行搜索,所以此时传统的搜索方式已无法满足消费者的要求。而通过简单的文字搜索再对搜索结果进行浏览的方式,会因关键字的不准确而极大地限制用户的选择空间,所以本专利技术基于图像特征的图像主体的识别是目前最有效的可以满足高精度检索的方法。现有的以图搜图技术即GoogleSearchbyImage,LVanHeerden,SIDuminy,NJLuwes三位学者在Googlesearchbyimage:asystemevaluationofadjustedimagesforthedetectionofvisualplagiarismv中提到了google现有的图像搜索算法进行了概括,基本包括三个步骤:首先将目标图片进行特征提取,描述的算法有很多,可以根据不同的图像,设计不同的算法,比如图像局部N阶矩的方法提取图像特征;然后将图像特征信息进行编码,并将海量图像编码做查找表,最后进行相似度匹配运算:利用目标图像的编码值,在图像搜索引擎中的图像数据库进行全局或是局部的相似度计算;根据所需要的鲁棒性,设定阈值,然后将相似度高的图片预保留下来;最后应该还有一步筛选最佳匹配图片。该方法对图像特征信息进行编码后做成查找表,特征标注越多,虽然可以提高搜索精度,但是无法避免查找时间会受到的限制;在相似度匹配计算时,阈值的确定虽然依据所需要的鲁棒性确定,但是在选择时还是需要多次试验才能最终确认。该方法在图片语义的分析上仍停留在较为基础的阶段,致使一些特殊输入图片得不到正确的匹配结果,而且大多时候会受到网络限制,真正应用于国内会不太容易实现。
技术实现思路
本专利技术的目的在于可以在用户搜索时手中仅有物品图片其他相关信息较少的的情况下,提供一种能够有效地根据用户提供的图片分析,得到正确的物体种类特征继而进行高效搜索的工具。实现本专利技术目的的技术解决方案为:一种基于图像特征的图像主体的识别方法,步骤如下:第一步,标注选取好的训练集的特征,首先判断图片中物品的所属物种,根据不同的物种细化特征,如动物则标记具体所属科族,全身颜色,眼睛,鼻子的特性等;详细标注后作为训练集待用;第二步,选取n万张图片,对这n万张图像进行裁剪,达到统一的长宽规格,裁剪过程中若产生物体形变则替换为其他图片,继而利用高斯函数完成图像平滑,去除图像噪声排除干扰项;循环平滑过程直到处理结果不再改变,完成图像预处理过程,送至第三步;第三步,形态学处理即图像增强,利用直方图均衡化将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,凸显图像边缘点,然后利用图像分割,将图像划分为目标对象和其他部分;特征提取过程将前面提取出来的目标对象利用opencv中的格式转换算法转换为适合计算机后续处理的数值形式,最终形成能够直接供神经网络分辨的特征值,此时测试集的处理完成,等待第五步神经网络训练好后使用;第四步,分布式环境的搭建,首先在虚拟器中开三台ubuntu的虚拟机,将下载好的辅助软件完成安装,为每一台搭建好java环境,正常安装hadoop,继而完成伪分布式配置;然后将上述实验过程转移到ubuntu的服务器上;利用搭建好的分布式环境试验hadoop自带的例子——词频统计,后台观察数据量相同时的不同数量机器的工作效率,发现六台时达到一个小顶点;第五步,用标注好特征的训练集训练人工神经网络(ANN),编程创建由多个简单的神经元相互密集连接形成的神经网络,其中每个神经元由三部分构成:输入、计算激励函数的细胞体和输出,神经元具有两种状态:1和0,神经元之间由可调节的权值相连,权值的设定采用监督性的多变量线性回归函数;每个神经元代表一个特征并接受一定数量的来自其他神经元的实数值输入,人工神经细胞通过激励函数对这些输入信号进行并进行阈值处理;如果整合后刺激值超过某一阈值,则神经元被激活进入1状态,否则处于0状态,当一系列的神经元被触发后即得到一个实际输出值;然后利用成本函数评估实际输出与目标输出的误差,若误差很小,则强化该权值,若误差很大,则改变学习的算法以弱化该权值;最后会得到一个成熟的神经网络,用这个神经网络为前面处理好的测试集标注特征;第六步,利用上述训练完成的神经网络为输入的新的测试图像标注特征,输入一张图像,神经网络完成特征的识别并标注后,利用分布式环境,并行加速的在测试集中搜索最相近的图片并输出,根据输出值判断是否需要再次对神经网络进行强化权值的训练过程。本专利技术与现有技术相比,其显著优点为:(1)分布式处理配合搜索过程可以提高机器学习效率和搜索速率,在处理过程中各步骤的所用时间被及时的记录。比较在不同数量的分布式处理机下对提高效率的影响,及时调整处理机的数量;(2)神经网络可以发掘图像的隐含特征,简单图像所包含的隐式特征不会对识别造成太多影响,但是动物类或家具类等复杂图像的隐式特征若不经多次分层提取,会严重降低正确率,我们的方法有效避免了这种问题;(3)手动标记特征的图片作为机器学习的训练库,在模型标记后进行抽样检查,进一步提高知识库的质量,从两方面提高识别结果的正确性;(4)没有网络限制,服务器位于国内,增添了极大的使用价值和搜索稳定性,充分满足用户的需求。附图说明图1是本专利技术基于图像特征的图像主体的识别方法2000张手动标记好特征的训练库。图2是本专利技术基于图像特征的图像主体的识别方法神经元结构图。图3是本专利技术基于图像特征的图像主体的识别方法神经网络训练模型流程。图4是本专利技术基于图像特征的图像主体的识别方法利用caffe完成图像特征提取结果。图5是本专利技术基于图像特征的图像主体的识别方法六个分布节点均配置成功,采用hadoopdfsadmin-report查看集群状态,发现六个节点均运行正常。图6是本专利技术基于图像特征的图像主体的识别方法对10万张图处理多次运行结果可以得到平均时间为22.4s。具体实施方式本专利技术利用人工标记好的正确图片特征,通过特征提取和神经网络训练成熟的模型,标记大型知识库,继而检索输入图片的特征输出具有相似特征的图片。具体技术可分为六部分:一是训练集的特征标注标注选取本文档来自技高网
...
基于图像特征的图像主体的识别方法

【技术保护点】
一种基于图像特征的图像主体的识别方法,其特征在于步骤如下:第一步,标注选取好的训练集的特征,首先判断图片中物品的所属物种,根据不同的物种细化特征,详细标注后作为训练集待用;第二步,选取n万张图片,对这n万张图像进行裁剪,达到统一的长宽规格,裁剪过程中若产生物体形变则替换为其他图片,继而利用高斯函数完成图像平滑,去除图像噪声排除干扰项;循环平滑过程直到处理结果不再改变,完成图像预处理过程,送至第三步;第三步,形态学处理即图像增强,利用直方图均衡化将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,凸显图像边缘点,然后利用图像分割,将图像划分为目标对象和其他部分;特征提取过程将前面提取出来的目标对象利用opencv中的格式转换算法转换为适合计算机后续处理的数值形式,最终形成能够直接供神经网络分辨的特征值,此时测试集的处理完成,等待第五步神经网络训练好后使用;第四步,分布式环境的搭建,首先在虚拟器中开三台ubuntu的虚拟机,将下载好的辅助软件完成安装,为每一台搭建好java环境,正常安装hadoop,继而完成伪分布式配置;然后将上述实验过程转移到ubuntu的服务器上;利用搭建好的分布式环境试验hadoop自带的例子——词频统计,后台观察数据量相同时的不同数量机器的工作效率,发现六台时达到一个小顶点;第五步,用标注好特征的训练集训练人工神经网络(ANN),编程创建由多个简单的神经元相互密集连接形成的神经网络,其中每个神经元由三部分构成:输入、计算激励函数的细胞体和输出,神经元具有两种状态:1和0,神经元之间由可调节的权值相连,权值的设定采用监督性的多变量线性回归函数;每个神经元代表一个特征并接受一定数量的来自其他神经元的实数值输入,人工神经细胞通过激励函数对这些输入信号进行并进行阈值处理;如果整合后刺激值超过某一阈值,则神经元被激活进入1状态,否则处于0状态,当一系列的神经元被触发后即得到一个实际输出值;然后利用成本函数评估实际输出与目标输出的误差,若误差很小,则强化该权值,若误差很大,则改变学习的算法以弱化该权值;最后会得到一个成熟的神经网络,用这个神经网络为前面处理好的测试集标注特征;第六步,利用上述训练完成的神经网络为输入的新的测试图像标注特征,输入一张图像,神经网络完成特征的识别并标注后,利用分布式环境,并行加速的在测试集中搜索最相近的图片并输出,根据输出值判断是否需要再次对神经网络进行强化权值的训练过程。...

【技术特征摘要】
1.一种基于图像特征的图像主体的识别方法,其特征在于步骤如下:第一步,标注选取好的训练集的特征,首先判断图片中物品的所属物种,根据不同的物种细化特征,详细标注后作为训练集待用;第二步,选取n万张图片,对这n万张图像进行裁剪,达到统一的长宽规格,裁剪过程中若产生物体形变则替换为其他图片,继而利用高斯函数完成图像平滑,去除图像噪声排除干扰项;循环平滑过程直到处理结果不再改变,完成图像预处理过程,送至第三步;第三步,形态学处理即图像增强,利用直方图均衡化将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,凸显图像边缘点,然后利用图像分割,将图像划分为目标对象和其他部分;特征提取过程将前面提取出来的目标对象利用opencv中的格式转换算法转换为适合计算机后续处理的数值形式,最终形成能够直接供神经网络分辨的特征值,此时测试集的处理完成,等待第五步神经网络训练好后使用;第四步,分布式环境的搭建,首先在虚拟器中开三台ubuntu的虚拟机,将下载好的辅助软件完成安装,为每一台搭建好java环境,正常安装hadoop,继而完成伪分布式配置;然后将上述实验过程转移到ubuntu的服务器上;利用搭建好的分布式环境试验hadoop自带的例子——词频统计,后台观察数据量相同时的不同数量机器的工作效率,发现六台时达到一个小顶点;第五步,用标注好特征的训练集训练人工神经网络(ANN),编程创建由多个简单的神经元相互密集连接形成的神经网络,其中每个神经元由三部分构成:输入、计算激励函数的细胞体和输出,神经元具有两种状态:1和0,神经元之间由可调节的权值相连,权值的设定采用监督性的多变量线性回归函数;每个神经元代表一个特征并接受一定数量的来自其他神经元的实数值输入,人工神经细胞通过激励函数对这些输入信号进行并进行阈值处理;如果整合后刺激值超过某一阈值,则神经元被激活进入1状态,否则处于0状态,当一系列的神经元被触发后即得到一个实际输出值;然后利用成本函数评估实际输出与目标输出的误差,若误差很小,则强化该权值,若误差很大,则改变学习的算法以弱化该权值;最后会得到一个成熟的神经网络,用这个神经网络为前面处理好的测试集标注特征;第六步,利用上述训练完成的神经网络为输入的新的测试图像标注特征,输入一张图像,神经网络完成特征的识别并标注后,利用分布式环境,并行加速的在测试集中搜索最相近的图片并输出,根据输出值判断是否需要再次对神经网络进行强化权值的训练过程。2.根据权利要求1所述的基于图像特征的图像主体的识别方法,其特征在于第...

【专利技术属性】
技术研发人员:魏子涵王李娜刘继振
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1