基于词汇树检索与相似度验证的云端图像识别方法技术

技术编号:15691038 阅读:86 留言:0更新日期:2017-06-24 03:55
本发明专利技术公开了一种基于词汇树检索与相似度验证的云端图像识别方法,包括以下步骤,图像获取步骤:获取目标图像,并对目标图像使用ORB算法提取所有ORB特征点,生成目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用基于词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,相似度验证步骤:在云端图像数据库中找到候选图像,得到目标图像和候选图像的128维向量,分别计算目标图像与各候选图像之间的距离,并找出距离最短的候选图像。采用该方法网络较差对识别的速度影响小,检索速度快且检索精度高。

Cloud image recognition method based on lexical tree retrieval and similarity verification

The invention discloses a vocabulary tree retrieval of cloud image recognition and similarity based authentication, which includes the following steps: image acquisition step target image, and the target image algorithm to extract all the ORB features using ORB, ORB descriptor sequence generation target image; image upload steps: the ORB descriptor based on sequence uploaded to the cloud image database descriptors sample; image recognition steps: cloud image database retrieval algorithm using vocabulary tree of image matching identification and returns the matching degree N candidate graph on the image based on the similarity verification steps: find the candidate images in the cloud image database, 128 dimensional vector of target image and candidate images. Were calculated between the target image and the candidate image distance and the shortest distance to find the candidate image. Using this method, the network is poor, it has little influence on the speed of recognition, fast retrieval speed and high retrieval accuracy.

【技术实现步骤摘要】
基于词汇树检索与相似度验证的云端图像识别方法
本专利技术涉及图像识别
,具体涉及一种基于词汇树检索与相似度验证的云端图像识别方法。
技术介绍
实时图像搜索是一种可以支持用户自定义的,超大规模的图像数据库的实时图像识别技术。它可以实现对移动端设备的图像输入内容进行实时的识别。整个识别过程是在云端进行的,这样可以使用户无需将庞大的图像数据库下载到本地,并且也可以充分地利用云端计算资源对数据库进行高速的检索。然而,目前基于云端的实时图像识别技术其通过上传本地图片到服务器,服务器将带识别的图片与存储的图片逐一进行比较,其存在以下缺陷:在无线网络较差的情况下,用户实时上传图像的速度会受到很大影响。
技术实现思路
本专利技术为了解决上述技术问题提供一种基于词汇树检索与相似度验证的云端图像识别方法。本专利技术通过下述技术方案实现:基于词汇树检索与相似度验证的云端图像识别方法,包括以下步骤,图像获取步骤:获取目标图像,并对目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用基于词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;相似度验证步骤:在云端图像数据库中找到候选图像,得到目标图像和候选图像的128维向量,分别计算目标图像与各候选图像之间的距离,并找出距离最短的候选图像。本专利技术通过提取目标图像的ORB特征点以生成ORB描述子序列,并将ORB描述子序列上传至基于描述子样本的云端图像数据库中进行检索匹配,相比于上传目标图像的方式,描述子的数据量小,减小对网络的要求,即网络较差对识别的速度影响小。利用词汇树检索算法找出匹配度靠前的N张图像后利用目标图像和候选图像之间的距离进行相似性验证,该相似性验证为小规模的,即可保证快速检索,也极大的提高了检索的精度。所述云端图像数据库的生成方法包括以下步骤:描述子生成步骤:收集图片,提取每张图片的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图片,建立树状结构的图像数据库。现有的图像匹配是图像和图像之间的匹配,检索的时间的增加随着图像的增加线性增长。一个特征描述子到数据库里匹配所有特征描述子,数据库里的描述子越多,匹配的时间就越长,因为暴力匹配是一一匹配,最后寻找距离最短的匹配组。在保证一定准确度的前提下,其检索速度和广度存在矛盾,这两点都与云端图像数据库的大小密切相关。而采用上述方法,由于数据库中的描述子已经进行树状分类,在进行匹配的时候,待匹配的描述子会寻找与其最相似的分支,而不需要遍历真个数据库,即树状检索结构可以让待匹配的特征描述子不用一一匹配所有的描述子,检索时间主要跟经过的节点数有关系,数据库中的描述子多不代表检索经过的节点数越多。所以检索时间不是按数据库的大小线性增加,而是对数增长,解决检索广度与速度之间的矛盾。而对于新加入图像描述子会加入相应的分支,而不是单纯的增加,因此在广度上也能很好的解决大数据库的检索情况。所述描述子生成步骤具体为:收集图片,分别对每张图片进行缩放以建立一个图像金字塔,对图片的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。所述树状模型生成步骤为:利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。所述树状模型生成步骤具体为:A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;A4、对所有的子节点依次排序标号,生成图像数据库的树状模型。所述数据库生成步骤为:B1、给图片一个唯一的编号;B2、对该图片进行缩放以建立一个图像金字塔,对图片的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子;B3、将该图片的所有描述子利用树状模型进行分类,并将每个描述子的分类结果关联在其分配到的子节点上;B3、对每一张图片做B1至B3的步骤,得到具有树状结构的图像数据库。获得目标图像和候选图像的128维向量在相似度验证系统中进行。所述相似度验证系统生成方法包括以下步骤,C1、将图像库中的图像输入神经网络模型,得到每张图对应的1024维的经过归一化的描述子;C2、将图像库中的图像进行三字节的学习,建立正样本与正样本之间的紧密距离、正样本与负样本之间的疏远距离。本专利技术与现有技术相比,具有如下的优点和有益效果:1、本专利技术得图像数据库基于描述子样本构建,在识别目标图像时,通过对目标图像描述子的提取实现检索匹配,相比于目标图像,描述子的数据量小,网络较差对识别的速度影响小。2、本专利技术利用词汇树检索算法找出匹配度靠前的N张图像后利用目标图像和候选图像之间的距离进行相似性验证,该相似性验证为小规模的,保证了快速检索的同时极大提高检索的精度。3、本专利技术的方法基于树状检索结构,其可让待匹配的特征描述子不用一一匹配所有的描述子,检索时间主要跟经过的节点数有关系,随着图片数量的增加,其检索时间不是按数据库的大小线性增加,而是对数增长,大大提高检索速度。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例,对本专利技术作进一步的详细说明,本专利技术的示意性实施方式及其说明仅用于解释本专利技术,并不作为对本专利技术的限定。实施例1本实施例公开一种基于描述子样本的云端图像数据库的生成方法,包括以下步骤:描述子生成步骤:收集图片,提取每张图片的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图片,建立树状结构的图像数据库。具体的:在描述子生成步骤中,收集的图片数量要多且来自各种场景,一般需要几万张,其存放在一个文件夹内,常用的图片格式均可,譬如JPG、JPEG、JPE、JFIF、BMP;分别对每张图片进行一定的缩放比例以建立一个图像金字塔,对图片的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。对收集到的每个图片均做该步骤的处理,ORB特征点的描述子是一个128位的二进制序列。在树状模型生成步骤中,利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。树状模型生成后一般不做改动。较为详细的,可采用下述步骤方法:A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;A3、若该子节点内描述子样本的数量大于K的本文档来自技高网...

【技术保护点】
基于词汇树检索与相似度验证的云端图像识别方法,其特征在于,包括以下步骤,图像获取步骤:获取目标图像,并对目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用基于词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;相似度验证步骤:在云端图像数据库中找到候选图像,得到目标图像和候选图像的128维向量,分别计算目标图像与各候选图像之间的距离,并找出距离最短的候选图像。

【技术特征摘要】
1.基于词汇树检索与相似度验证的云端图像识别方法,其特征在于,包括以下步骤,图像获取步骤:获取目标图像,并对目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用基于词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;相似度验证步骤:在云端图像数据库中找到候选图像,得到目标图像和候选图像的128维向量,分别计算目标图像与各候选图像之间的距离,并找出距离最短的候选图像。2.根据权利要求1所述的基于词汇树检索与相似度验证的云端图像识别方法,其特征在于,所述云端图像数据库的生成包括以下步骤,描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。3.根据权利要求2所述的基于词汇树检索与相似度验证的云端图像识别方法,其特征在于,所述描述子生成步骤具体为:收集图像,分别对每张图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。4.根据权利要求2所述的基于词汇树检索与相似度验证的云端图像识别方法,其特征在于,所述树状模型生成步骤为:利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。5.根据权利...

【专利技术属性】
技术研发人员:施茂燊
申请(专利权)人:深圳前海大造科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1