基于结构最优子空间学习的图像特征二值编码表示方法技术

技术编号：19060854 阅读：25 留言：0更新日期：2018-09-29 12:58

本发明专利技术公开了基于结构最优子空间学习的图像特征二值编码表示方法，包括：步骤1，将原始数据进行预处理，计算得到新数据；步骤2，学习哈希函数的投影参数，投影参数w为本发明专利技术用于计算图像特征二值编码而定义的哈希函数形式的一个参数。此步骤采用松弛策略，将原始问题转换为先学习投影参数w，后学习偏移参数t，此步骤学习投影参数w；步骤3，学习哈希函数的偏移参数t。此步骤重新考虑取符号函数的影响，看作是对步骤2中放松限制的一种补偿。

全部详细技术资料下载

【技术实现步骤摘要】
基于结构最优子空间学习的图像特征二值编码表示方法
本专利技术属于图像特征编码领域，尤其涉及基于结构最优子空间学习的图像特征二值编码表示方法。
技术介绍
针对大规模数据设计快速索引算法具有广泛的应用价值，例如目标识别、图像检索、图像匹配等。在构建高效的大规模数据检索系统时，存在两个最主要的瓶颈：数据的存储需求和检索效率。在图像检索的应用中，用户给定一个查询图像，需要从大规模数据库中检索出与其相似的图像，并根据相似度排名返回结果。针对这个应用场景，一种最基本的做法是：首先对查询图像和数据库图像分别提取特征。然后，根据一定的度量方式(例如欧氏距离)计算查询图像和每个数据库图像之间的距离。最后，根据距离大小对数据库图像进行排序，返回靠前的数据库图像作为检索结果。然而图像、视频等数据往往具有高维度的特征，如果不对原始数据进行压缩，则需要非常大的空间来存储，随着时间的推移，数据量以飞快的速度增长，这样的存储方式将越来越难以适应。同时，数据规模大必将对检索造成很大的不便。显然，在这种情况下，线性的检索方式已经不合适。
技术实现思路
专利技术目的：本专利技术为了解决现有技术中的问题，提出了一种基于结构最优子空间学习的图像特征二值编码表示方法，从而有效解决基于哈希二值编码的数据下，图像的快速准确检索问题。通过本专利技术构建的基于结构最优子空间学习的图像特征二值编码表示方法，旨在利用机器学习与机器视觉的手段，针对传统的图像检索技术中出现的特征维度高、检索效率低等问题，考虑到同类数据的局部性和不同类数据的判别性，采用较为稀疏的编码方式，通过基于结构最优子空间学习的图像特征二值编码表...

【技术保护点】
1.基于结构最优子空间学习的图像特征二值编码表示方法，其特征在于，包括以下步骤：步骤1，数据预处理：将原始数据进行数据预处理；步骤2，哈希函数投影参数学习：用于计算图像特征二值编码而定义的哈希函数形式有两个参数，投影参数w和偏移参数t，采用松弛策略，学习投影参数w；步骤3，哈希函数偏移参数学习：学习偏移参数t，根据学习得到哈希函数的投影参数和偏移参数，得到哈希函数的完整表达形式，计算得到原始数据经过哈希函数索引后的二值编码。

【技术特征摘要】
1.基于结构最优子空间学习的图像特征二值编码表示方法，其特征在于，包括以下步骤：步骤1，数据预处理：将原始数据进行数据预处理；步骤2，哈希函数投影参数学习：用于计算图像特征二值编码而定义的哈希函数形式有两个参数，投影参数w和偏移参数t，采用松弛策略，学习投影参数w；步骤3，哈希函数偏移参数学习：学习偏移参数t，根据学习得到哈希函数的投影参数和偏移参数，得到哈希函数的完整表达形式，计算得到原始数据经过哈希函数索引后的二值编码。2.如权利要求1所述的方法，其特征在于，步骤1包括如下步骤：步骤1-1，给定为N个d维原始数据的集合，其中Rd表示集合X中的每一个元素维度都为d且值属于实数集R，xi表示第i个d维原始数据，对所有原始数据进行零均值预处理，Y＝{y1,y2,...,yN}为各原始数据对应的语义标签集合，yN表示第N个d维原始数据xN对应的语义标签，H＝{h1,h2,...,hK}为一组共K个哈希函数集合，hK表示第K个哈希函数，则对于第i个d维原始数据xi，经过第k个哈希函数进行计算后，k取值为1～K，得到一位二进制编码hk(xi)：其中，wk是第k个投影参数，tk是第k个偏移参数，第i个d维原始数据xi经过一个哈希函数索引后，其二值编码其中w是投影参数，t是偏移参数；步骤1-2，在原始数据的集合X上，由于给定了语义标签集合，能够获得两个集合M和C，其中集合M是原始数据的集合X中一类原始数据的集合，集合C是集合M对于原始数据的集合X的补集，表示剩下所有类原始数据的集合，即M∪C＝X且yi＝yj，j取值为1～N；步骤1-3，对于集合M，定义近邻之间的距离的衡量类内聚合度LM，即最小化编码空间中近邻之间的平均距离；对于集合C，定义数据与数据中心的距离的衡量类内聚合度LC，即最小化编码空间中数据与类中心之间的平均距离；对于集合M和C，定义M和C数据中心的距离的衡量类间离散度LB，即最大化编码空间中类中心与类中心之间的距离。3.如权利要求2所述的方法，其特征在于，步骤1-3中，所述LM、LC、LB的计算表达公式分别如下：LB＝Φ(h,μC,μM)，其中，NN(xi)表示第i个d维原始数据xi的近邻集合，Φ(h,xi,xj)表示第i个d维原始数据xi和第j个d维原始数据xj经过哈希函数编码后的差异，μC和μM分别是集合M的数据中心和集合C的数据中心。4.如权利要求3所述的方法，其特征在于，Φ(h,xi,xj)能够表示为：即第i个d维原始数据xi经过编码后得到的哈希值和第j个d维原始数据xj经过编码后得到的哈希值若则Φ(h,xi,xj)的值为零，若则Φ(h,xi,xj)值为一个正数，且之间相差越多，Φ(h,xi,xj)越大。5.如权利要求4所述的方法，其特征在于，LM进一步表示为：LC进一步...

【专利技术属性】
技术研发人员：杨育彬，甘元柱，刘路飞，张开军，毛晓蛟，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人