The invention discloses an image main body recognition method based on image characteristics. The preliminary processing method first image, further enhancing the image features through the picture, separate the foreground and background are area; morphological processing is mainly used for image feature extraction, segmentation is to partition an image into components or objects; image feature extraction is to image elements or objects in front of the extracted expressed as a numerical form suitable for subsequent computer processing, and ultimately the formation of features used for machine learning classifier model can directly generate the distributed environment; provide the search efficiency and parallel computing ability; the input image by the method identified feature data after image search and output the most similar, judge whether the two match. The invention not only provides a stable and feasible method of image search, analysis of learning depth on the semantics of images, improve the search time and speed, while avoiding the network constraints, the universality is very high.
【技术实现步骤摘要】
基于图像特征的图像主体的识别方法
本专利技术涉及如何提取图像隐藏信息完成大型图像库的分类后进行高效识别,并将结果输出以供使用的方法,特别是一种基于图像特征的图像主体的识别方法。在提高检索效率方面做出了非常大的进步提升,故应用前景广泛。
技术介绍
基于图像特征的图像主体的识别方法是指仅需消费者提供所需物品的图片,便可通过本方法获得改物品的特征信息。随着WWW的急剧增长以及多媒体技术的飞速发展,快速有效地进行互联网图片信息检索、查询和浏览,成为人们的迫切需求。目前,一些现存的方法的图片搜索方法,大多是采用基于文本关键字和链接信息来进行图片的搜索和检索,并没有利用图片本身的视觉内容信息,其检索精确度受到一定的限制。而一些基于内容的图片检索系统则仅仅利用图片的内容信息来进行图片检索,难于解决语义鸿沟的问题。如果用户手上有一张图片,用以上方法查询这张图片的内部信息显然很不方便,因为一般来说,图片搜索只是分析同关键词有关的网络图片,而图片的内容因为多种原因不会被纳入到搜索的范畴里,例如在搜图网站上搜索一个用户感兴趣的物品,用户手上有它的照片,但是不知道它的具体信息如图片所描述的对象的种类,那就无从下手进行搜索,所以此时传统的搜索方式已无法满足消费者的要求。而通过简单的文字搜索再对搜索结果进行浏览的方式,会因关键字的不准确而极大地限制用户的选择空间,所以本专利技术基于图像特征的图像主体的识别是目前最有效的可以满足高精度检索的方法。现有的以图搜图技术即GoogleSearchbyImage,LVanHeerden,SIDuminy,NJLuwes三位学者在Googlese ...
【技术保护点】
一种基于图像特征的图像主体的识别方法,其特征在于步骤如下:第一步,标注选取好的训练集的特征,首先判断图片中物品的所属物种,根据不同的物种细化特征,详细标注后作为训练集待用;第二步,选取n万张图片,对这n万张图像进行裁剪,达到统一的长宽规格,裁剪过程中若产生物体形变则替换为其他图片,继而利用高斯函数完成图像平滑,去除图像噪声排除干扰项;循环平滑过程直到处理结果不再改变,完成图像预处理过程,送至第三步;第三步,形态学处理即图像增强,利用直方图均衡化将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,凸显图像边缘点,然后利用图像分割,将图像划分为目标对象和其他部分;特征提取过程将前面提取出来的目标对象利用opencv中的格式转换算法转换为适合计算机后续处理的数值形式,最终形成能够直接供神经网络分辨的特征值,此时测试集的处理完成,等待第五步神经网络训练好后使用;第四步,分布式环境的搭建,首先在虚拟器中开三台ubuntu的虚拟机,将下载好的辅助软件完成安装,为每一台搭建好java环境,正常安装hadoop,继而完成伪分布式配置;然后将上述实验过程转移到ubuntu的服务器上;利用搭建 ...
【技术特征摘要】
1.一种基于图像特征的图像主体的识别方法,其特征在于步骤如下:第一步,标注选取好的训练集的特征,首先判断图片中物品的所属物种,根据不同的物种细化特征,详细标注后作为训练集待用;第二步,选取n万张图片,对这n万张图像进行裁剪,达到统一的长宽规格,裁剪过程中若产生物体形变则替换为其他图片,继而利用高斯函数完成图像平滑,去除图像噪声排除干扰项;循环平滑过程直到处理结果不再改变,完成图像预处理过程,送至第三步;第三步,形态学处理即图像增强,利用直方图均衡化将原始图像的直方图通过积分概率密度函数转化为概率密度为1的图像,凸显图像边缘点,然后利用图像分割,将图像划分为目标对象和其他部分;特征提取过程将前面提取出来的目标对象利用opencv中的格式转换算法转换为适合计算机后续处理的数值形式,最终形成能够直接供神经网络分辨的特征值,此时测试集的处理完成,等待第五步神经网络训练好后使用;第四步,分布式环境的搭建,首先在虚拟器中开三台ubuntu的虚拟机,将下载好的辅助软件完成安装,为每一台搭建好java环境,正常安装hadoop,继而完成伪分布式配置;然后将上述实验过程转移到ubuntu的服务器上;利用搭建好的分布式环境试验hadoop自带的例子——词频统计,后台观察数据量相同时的不同数量机器的工作效率,发现六台时达到一个小顶点;第五步,用标注好特征的训练集训练人工神经网络(ANN),编程创建由多个简单的神经元相互密集连接形成的神经网络,其中每个神经元由三部分构成:输入、计算激励函数的细胞体和输出,神经元具有两种状态:1和0,神经元之间由可调节的权值相连,权值的设定采用监督性的多变量线性回归函数;每个神经元代表一个特征并接受一定数量的来自其他神经元的实数值输入,人工神经细胞通过激励函数对这些输入信号进行并进行阈值处理;如果整合后刺激值超过某一阈值,则神经元被激活进入1状态,否则处于0状态,当一系列的神经元被触发后即得到一个实际输出值;然后利用成本函数评估实际输出与目标输出的误差,若误差很小,则强化该权值,若误差很大,则改变学习的算法以弱化该权值;最后会得到一个成熟的神经网络,用这个神经网络为前面处理好的测试集标注特征;第六步,利用上述训练完成的神经网络为输入的新的测试图像标注特征,输入一张图像,神经网络完成特征的识别并标注后,利用分布式环境,并行加速的在测试集中搜索最相近的图片并输出,根据输出值判断是否需要再次对神经网络进行强化权值的训练过程。2.根据权利要求1所述的基于图像特征的图像主体的识别方法,其特征在于第...
【专利技术属性】
技术研发人员:魏子涵,王李娜,刘继振,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。