当前位置: 首页 > 专利查询>南京大学专利>正文

基于结构最优子空间学习的图像特征二值编码表示方法技术

技术编号:19060854 阅读:25 留言:0更新日期:2018-09-29 12:58
本发明专利技术公开了基于结构最优子空间学习的图像特征二值编码表示方法,包括:步骤1,将原始数据进行预处理,计算得到新数据;步骤2,学习哈希函数的投影参数,投影参数w为本发明专利技术用于计算图像特征二值编码而定义的哈希函数形式的一个参数。此步骤采用松弛策略,将原始问题转换为先学习投影参数w,后学习偏移参数t,此步骤学习投影参数w;步骤3,学习哈希函数的偏移参数t。此步骤重新考虑取符号函数的影响,看作是对步骤2中放松限制的一种补偿。

【技术实现步骤摘要】
基于结构最优子空间学习的图像特征二值编码表示方法
本专利技术属于图像特征编码领域,尤其涉及基于结构最优子空间学习的图像特征二值编码表示方法。
技术介绍
针对大规模数据设计快速索引算法具有广泛的应用价值,例如目标识别、图像检索、图像匹配等。在构建高效的大规模数据检索系统时,存在两个最主要的瓶颈:数据的存储需求和检索效率。在图像检索的应用中,用户给定一个查询图像,需要从大规模数据库中检索出与其相似的图像,并根据相似度排名返回结果。针对这个应用场景,一种最基本的做法是:首先对查询图像和数据库图像分别提取特征。然后,根据一定的度量方式(例如欧氏距离)计算查询图像和每个数据库图像之间的距离。最后,根据距离大小对数据库图像进行排序,返回靠前的数据库图像作为检索结果。然而图像、视频等数据往往具有高维度的特征,如果不对原始数据进行压缩,则需要非常大的空间来存储,随着时间的推移,数据量以飞快的速度增长,这样的存储方式将越来越难以适应。同时,数据规模大必将对检索造成很大的不便。显然,在这种情况下,线性的检索方式已经不合适。
技术实现思路
专利技术目的:本专利技术为了解决现有技术中的问题,提出了一种基于结构最优子空间学习的图像特征二值编码表示方法,从而有效解决基于哈希二值编码的数据下,图像的快速准确检索问题。通过本专利技术构建的基于结构最优子空间学习的图像特征二值编码表示方法,旨在利用机器学习与机器视觉的手段,针对传统的图像检索技术中出现的特征维度高、检索效率低等问题,考虑到同类数据的局部性和不同类数据的判别性,采用较为稀疏的编码方式,通过基于结构最优子空间学习的图像特征二值编码表示方法来达到提升图像检索性能和准确率的目的。技术方案:本专利技术公开了基于结构最优子空间学习的图像特征二值编码表示方法,提出了一种有监督的判别式哈希函数学习方法来进行二值编码的自动化解决方案,具体包括以下步骤:步骤1,数据预处理:将原始数据进行数据预处理;步骤2,哈希函数投影参数学习(W步骤):用于计算图像特征二值编码而定义的哈希函数形式有两个参数,投影参数w和偏移参数t,采用松弛策略,学习投影参数w;步骤3,哈希函数偏移参数学习(T步骤):学习偏移参数t,此步骤重新考虑取符号函数sign()的影响,看作是对W步骤中放松限制的一种补偿;根据学习得到哈希函数的投影参数和偏移参数,得到哈希函数的完整表达形式,计算得到原始数据经过哈希函数索引后的二值编码。基于二值编码的特征表示和学习算法的目的,是给定一组包含N个样本的训练集其中xi表示每个训练样本对应的d维特征向量,利用学习算法找到一组合适的哈希函数每个哈希函数对一个特征向量进行编码,将其映射成一位二进制数。然后,学习一组哈希函数组合G(x)=[h1(x),h2(x),...,hg(x)],并用其对每个特征进行编码得到低维的二进制串,其中g<<d。编码和原始数据的相比维度较低,且其二进制的形式能够有效减少数据存储需求,实现大规模数据库高效的存储。步骤1包括如下步骤:步骤1-1,给定为N个d维原始数据的集合,其中Rd表示集合X中的每一个元素维度都为d且值属于实数集R,xi表示第i个d维原始数据,对所有原始数据进行零均值预处理(参考文献:《机器学习》周志华清华大学出版社),Y={y1,y2,...,yN}为各原始数据对应的语义标签集合,yN表示第N个d维原始数据xN对应的语义标签,H={h1,h2,...,hK}为一组共K个哈希函数集合,hK表示第K个哈希函数,则对于第i个d维原始数据xi,经过第k个哈希函数进行计算后,k取值为1~K,得到一位二进制编码hk(xi):其中,wk是第k个投影参数,tk是第k个偏移参数,第i个d维原始数据xi经过一个哈希函数索引后,其二值编码其中w是投影参数,t是偏移参数;步骤1-2,在原始数据的集合X上,由于给定了语义标签集合,能够获得两个集合M和C,其中集合M是原始数据的集合X中一类原始数据的集合,集合C是集合M对于原始数据的集合X的补集,表示剩下所有类原始数据的集合,即M∪C=X且yi=yj,j取值为1~N;步骤1-3,对于集合M,定义近邻之间的距离的衡量类内聚合度LM,即最小化编码空间中近邻之间的平均距离;对于集合C,定义数据与数据中心的距离的衡量类内聚合度LC,即最小化编码空间中数据与类中心之间的平均距离;对于集合M和C,定义M和C数据中心的距离的衡量类间离散度LB,即最大化编码空间中类中心与类中心之间的距离。步骤1-3中,所述LM、LC、LB的计算表达公式分别如下:LB=Φ(h,μC,μM),其中,NN(xi)表示第i个d维原始数据xi的近邻集合,Φ(h,xi,xj)表示第i个d维原始数据xi和第j个d维原始数据xj经过哈希函数编码后的差异,μC和μM分别是集合M的数据中心和集合C的数据中心。Φ(h,xi,xj)能够表示为:即第i个d维原始数据xi经过编码后得到的哈希值和第j个d维原始数据xj经过编码后得到的哈希值若则Φ(h,xi,xj)的值为零,若则Φ(h,xi,xj)值为一个正数,且之间相差越多,Φ(h,xi,xj)越大。LM进一步表示为:LC进一步表示为:LB进一步表示为:步骤2包括如下步骤:步骤2-1,从步骤1-1得知,第i个d维原始数据xi经过一个哈希函数索引后,其二值编码则哈希函数h(x)形式为:h(x)=sign(wTx+t),其中表示原始数据在d维空间中的特征向量,是投影向量,t是偏移参数,sign()是取符号函数;步骤2-2,定义损失函数L如下:其中,LB为类间散列度,LW为类内散列度;最优的哈希函数即优化目标函数L(w,t):其中,w*,t*分别指使得损失函数L取得最大值时投影参数w的取值和偏移参数t的取值;由于函数h(x)中使用了不可微的取符号函数sign(),对于这个问题采取了松弛的策略,对sign()函数放松限制,于是得到新的目标函数则对于任意xi∈C,得到:为采取松弛策略之后,集合C的类内散列度LC的新的表示形式;表示为:为采取松弛策略之后,类间散列度LB的新的表示形式,对于进一步得到如下表示为采取松弛策略之后,集合M的类内散列度LM的新的表示形式,其中,同时得到:最后整体的目标函数表示为:步骤2-3,引入拉格朗日乘子λ后,得到:即矩阵最大的特征值对应的特征向量,每一个特征向量能够表示一个哈希函数的投影向量,假设取特征值最大的前P个特征向量,得到投影矩阵其对应了P个哈希函数。步骤3包括如下步骤:步骤3-1,通过如下目标函数学习偏移参数t:L(T)=L1(T)-L2(T),其中:其中L(T)表示本步骤中用于学习偏移参数t需要优化的目标函数,T表示每个哈希函数投影向量对应的偏移量组成的向量,从集合M中随机采取相同语义的m个数据对,再分别从M和C中采取不同语义的c个数据对,L1(T)进一步表示为:其中Wp表示步骤2-3得到的投影矩阵中第p个特征向量,1≤p≤P,tp表示第p个特征向量对应的第p个偏移量;步骤3-2,求取偏移量T的目标函数为:该目标函数公式中,等号右边取最大值时tp的取值用表示,令:f(t)是的另一种记法,表示函数名是f,参数是t;由于和是已知的,则g(t)是关于t的二次函数:g(t)=t2+(ai+aj)t+aiaj,则当满足条件t<m本文档来自技高网...

【技术保护点】
1.基于结构最优子空间学习的图像特征二值编码表示方法,其特征在于,包括以下步骤:步骤1,数据预处理:将原始数据进行数据预处理;步骤2,哈希函数投影参数学习:用于计算图像特征二值编码而定义的哈希函数形式有两个参数,投影参数w和偏移参数t,采用松弛策略,学习投影参数w;步骤3,哈希函数偏移参数学习:学习偏移参数t,根据学习得到哈希函数的投影参数和偏移参数,得到哈希函数的完整表达形式,计算得到原始数据经过哈希函数索引后的二值编码。

【技术特征摘要】
1.基于结构最优子空间学习的图像特征二值编码表示方法,其特征在于,包括以下步骤:步骤1,数据预处理:将原始数据进行数据预处理;步骤2,哈希函数投影参数学习:用于计算图像特征二值编码而定义的哈希函数形式有两个参数,投影参数w和偏移参数t,采用松弛策略,学习投影参数w;步骤3,哈希函数偏移参数学习:学习偏移参数t,根据学习得到哈希函数的投影参数和偏移参数,得到哈希函数的完整表达形式,计算得到原始数据经过哈希函数索引后的二值编码。2.如权利要求1所述的方法,其特征在于,步骤1包括如下步骤:步骤1-1,给定为N个d维原始数据的集合,其中Rd表示集合X中的每一个元素维度都为d且值属于实数集R,xi表示第i个d维原始数据,对所有原始数据进行零均值预处理,Y={y1,y2,...,yN}为各原始数据对应的语义标签集合,yN表示第N个d维原始数据xN对应的语义标签,H={h1,h2,...,hK}为一组共K个哈希函数集合,hK表示第K个哈希函数,则对于第i个d维原始数据xi,经过第k个哈希函数进行计算后,k取值为1~K,得到一位二进制编码hk(xi):其中,wk是第k个投影参数,tk是第k个偏移参数,第i个d维原始数据xi经过一个哈希函数索引后,其二值编码其中w是投影参数,t是偏移参数;步骤1-2,在原始数据的集合X上,由于给定了语义标签集合,能够获得两个集合M和C,其中集合M是原始数据的集合X中一类原始数据的集合,集合C是集合M对于原始数据的集合X的补集,表示剩下所有类原始数据的集合,即M∪C=X且yi=yj,j取值为1~N;步骤1-3,对于集合M,定义近邻之间的距离的衡量类内聚合度LM,即最小化编码空间中近邻之间的平均距离;对于集合C,定义数据与数据中心的距离的衡量类内聚合度LC,即最小化编码空间中数据与类中心之间的平均距离;对于集合M和C,定义M和C数据中心的距离的衡量类间离散度LB,即最大化编码空间中类中心与类中心之间的距离。3.如权利要求2所述的方法,其特征在于,步骤1-3中,所述LM、LC、LB的计算表达公式分别如下:LB=Φ(h,μC,μM),其中,NN(xi)表示第i个d维原始数据xi的近邻集合,Φ(h,xi,xj)表示第i个d维原始数据xi和第j个d维原始数据xj经过哈希函数编码后的差异,μC和μM分别是集合M的数据中心和集合C的数据中心。4.如权利要求3所述的方法,其特征在于,Φ(h,xi,xj)能够表示为:即第i个d维原始数据xi经过编码后得到的哈希值和第j个d维原始数据xj经过编码后得到的哈希值若则Φ(h,xi,xj)的值为零,若则Φ(h,xi,xj)值为一个正数,且之间相差越多,Φ(h,xi,xj)越大。5.如权利要求4所述的方法,其特征在于,LM进一步表示为:LC进一步...

【专利技术属性】
技术研发人员:杨育彬甘元柱刘路飞张开军毛晓蛟
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1