一种基于词汇树检索与暴力匹配的图像识别方法技术

技术编号:15639664 阅读:138 留言:0更新日期:2017-06-16 00:59
本发明专利技术公开了一种基于词汇树检索与暴力匹配的图像识别方法,包括以下步骤,图像获取步骤:获取图像,并对该图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到云端图像数据库中;图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配识别并返回匹配得分靠前的N张候选图像;暴力匹配步骤:在云端图像数据库中找到候选图像,并对候选图像和图像的ORB描述子序列做一对一的暴力匹配以确定最佳匹配图像。其通过对图像描述子的提取实现检索匹配,网络较差对识别的速度影响小,且在词汇树结构大小有限的情况下检索精度高。

【技术实现步骤摘要】
一种基于词汇树检索与暴力匹配的图像识别方法
本专利技术涉及图像识别
,具体涉及一种基于词汇树检索与暴力匹配的图像识别方法。
技术介绍
实时图像搜索是一种可以支持用户自定义的,超大规模的图像数据库的实时图像识别技术。它可以实现对移动端设备的图像输入内容进行实时的识别。整个识别过程是在云端进行的,这样可以使用户无需将庞大的图像数据库下载到本地,并且也可以充分地利用云端计算资源对数据库进行高速的检索。然而,目前基于云端的实时图像识别技术其通过上传本地图片到服务器,服务器将带识别的图片与存储的图片逐一进行比较,其存在以下缺陷:在无线网络较差的情况下,用户实时上传图像的速度会受到很大影响。
技术实现思路
本专利技术为了解决上述技术问题提供一种基于词汇树检索与暴力匹配的图像识别方法。本专利技术通过下述技术方案实现:一种基于词汇树检索与暴力匹配的图像识别方法,包括以下步骤,图像获取步骤:获取目标图像,并对目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;暴力匹配步骤:在云端图像数据库中找到候选图像,并利用字符串匹配算法对候选图像和目标图像的ORB描述子序列做一对一的暴力匹配以确定最佳匹配图像。本专利技术通过提取目标图像的ORB特征点以生成ORB描述子序列,并将ORB描述子序列上传至基于描述子样本的云端图像数据库中进行检索匹配,相比于上传目标图像的方式,描述子的数据量小,减小对网络的要求,即网络较差对识别的速度影响小。在词汇树检索完成之后利用字符串匹配算法识别最佳匹配图像,保证了快速检索的同时极大提高检索的精度。所述云端图像数据库的生成方法包括以下步骤:描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。现有的图像匹配是图像和图像之间的匹配,检索的时间的增加随着图像的增加线性增长。一个特征描述子到数据库里匹配所有特征描述子,数据库里的描述子越多,匹配的时间就越长,因为暴力匹配是一一匹配,最后寻找距离最短的匹配组。在保证一定准确度的前提下,其检索速度和广度存在矛盾,这两点都与云端图像数据库的大小密切相关。而采用上述方法,由于数据库中的描述子已经进行树状分类,在进行匹配的时候,待匹配的描述子会寻找与其最相似的分支,而不需要遍历真个数据库,即树状检索结构可以让待匹配的特征描述子不用一一匹配所有的描述子,检索时间主要跟经过的节点数有关系,数据库中的描述子多不代表检索经过的节点数越多。所以检索时间不是按数据库的大小线性增加,而是对数增长,解决检索广度与速度之间的矛盾。而对于新加入图像描述子会加入相应的分支,而不是单纯的增加,因此在广度上也能很好的解决大数据库的检索情况。所述描述子生成步骤具体为:收集图像,分别对每张图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。所述树状模型生成步骤为:利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。所述树状模型生成步骤具体为:A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;A4、对所有的子节点依次排序标号,生成图像数据库的树状模型。所述数据库生成步骤为:B1、给图像一个唯一的编号;B2、对该图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子;B3、将该图像的所有描述子利用树状模型进行分类,并将每个描述子的分类结果关联在其分配到的子节点上;B4、对每一张图像做B1至B3的步骤,得到具有树状结构的图像数据库。作为优选,所述最佳匹配图像为暴力匹配中描述子序列的字符串匹配度最高的那张。本专利技术与现有技术相比,具有如下的优点和有益效果:1、本专利技术得图像数据库基于描述子样本构建,在识别目标图像时,通过对目标图像描述子的提取实现检索匹配,相比于图像,描述子的数据量小,网络较差对识别的速度影响小。2、本专利技术在词汇树检索完成之后利用字符串匹配算法识别最佳匹配图像,保证了快速检索的同时极大提高检索的精度。3、本专利技术的方法基于树状检索结构,其可让待匹配的特征描述子不用一一匹配所有的描述子,检索时间主要跟经过的节点数有关系,随着图片数量的增加,其检索时间不是按数据库的大小线性增加,而是对数增长,大大提高检索速度。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例,对本专利技术作进一步的详细说明,本专利技术的示意性实施方式及其说明仅用于解释本专利技术,并不作为对本专利技术的限定。实施例1本实施例公开一种基于描述子样本的云端图像数据库的生成方法,包括以下步骤:描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。具体的:在描述子生成步骤中,收集的图像数量要多且来自各种场景,一般需要几万张,其存放在一个文件夹内,常用的图像格式均可,譬如JPG、JPEG、JPE、JFIF、BMP;分别对每张图像进行一定的缩放比例以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。对收集到的每个图像均做该步骤的处理,ORB特征点的描述子是一个128位的二进制序列。在树状模型生成步骤中,利用描述子之间的欧式距离作为判据,对描述子样本用K-means算法做聚合分类,生成图像数据库的树状模型。树状模型生成后一般不做改动。较为详细的,可采用下述步骤方法:A1、定义一个树状结构,其最大层数为L,每层最大子节点数为K;A2、对描述子样本用K-means算法做聚合分类,得到子节点分类结果,将每个子节点内所有描述子的平均描述子作为该子节点的描述子;A3、若该子节点内描述子样本的数量大于K的两倍,则对该子节点内的描述子样本作进一步的K-means分类,重复该步骤,直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍;A4、在所有的K-means分类结束后,对所有的子节点从左到右依次排序标号,生成图像数据库的树状模型。向树状模型中添加所有需要的图像数据以形成图像数据库,将需要添加到树状模型中的图像存放在同一文件夹里,具体的可采用下述步本文档来自技高网...

【技术保护点】
一种基于词汇树检索与暴力匹配的图像识别方法,其特征在于,包括以下步骤,图像获取步骤:获取目标图像,并对该目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;暴力匹配步骤:在云端图像数据库中找到候选图像,并利用字符串匹配算法对候选图像和目标图像的ORB描述子序列做一对一的暴力匹配以确定最佳匹配图像。

【技术特征摘要】
1.一种基于词汇树检索与暴力匹配的图像识别方法,其特征在于,包括以下步骤,图像获取步骤:获取目标图像,并对该目标图像使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子,生成该目标图像的ORB描述子序列;图像上传步骤:将该ORB描述子序列上传到基于描述子样本的云端图像数据库中;图像识别步骤:云端图像数据库利用检索词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像,其中N为大于1的自然数;暴力匹配步骤:在云端图像数据库中找到候选图像,并利用字符串匹配算法对候选图像和目标图像的ORB描述子序列做一对一的暴力匹配以确定最佳匹配图像。2.根据权利要求1所述的一种基于词汇树检索与暴力匹配的图像识别方法,其特征在于,所述云端图像数据库的生成方法包括以下步骤:描述子生成步骤:收集图像,提取每张图像的ORB特征点,并对每个ORB特征点生成相应的描述子以得到描述子样本;树状模型生成步骤:根据描述子样本生成图像数据库的树状模型;数据库生成步骤:向树状模型中添加图像,建立树状结构的图像数据库。3.根据权利要求2所述的一种基于词汇树检索与暴力匹配的图像识别方法,其特征在于,所述描述子生成步骤具体为:收集图像,分别对每张图像进行缩放以建立一个图像金字塔,对图像的各个尺度使用ORB算法提取所有ORB特征点,并对每一个ORB特征点生成相应的描述子。4.根据权利要求2所述的一种基于词汇树检索与暴力匹配的图像识别方法,...

【专利技术属性】
技术研发人员:施茂燊
申请(专利权)人:深圳前海大造科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1