基于二值权重的图像哈希码训练模型算法及分类学习方法技术

技术编号:18972800 阅读:30 留言:0更新日期:2018-09-19 03:48
本发明专利技术公开了一种基于二值权重的哈希码图像训练模型,模型算法步骤包括:选择损失函数,确定目标方程,并对分类器和训练图像特征进行二值编码;对二值编码进行统一学习,更新二值码,优化损失函数;推导哈希码训练模型。还公开了一种应用基于二值权重的哈希码图像训练模型的分类学习方法,步骤包括:待搜索图像通过基于二值权重的哈希码训练模型得到哈希码,求出哈希码与分类器二值码之间的汉明距离;在汉明距离中查找最小汉明距离,并得到其对应的分类器,即为待搜索图像所属类别。本发明专利技术能够在多种图像类别和高纬度场景下进行图像分类,提高算法在大规模数据集上的性能,精确、高效、快捷且低内存消耗。

Image hash training model algorithm and classified learning method based on two valued weight

The invention discloses a hash code image training model based on binary weight. The model algorithm steps include: selecting loss function, determining target equation, and binary coding of classifier and training image features; unifying binary coding, updating binary code, optimizing loss function; deriving hash code training; Model. Also disclosed is a classification learning method using a hash code image training model based on binary weight. The steps include: the hash code is obtained from the hash code training model based on binary weight of the image to be searched, the Hamming distance between the hash code and the binary code of the classifier is calculated, and the minimum Hamming distance is found in the Hamming distance. And get its corresponding classifier, that is, the category to be searched. The invention can classify images in a variety of image categories and high latitude scenes, improve the performance of the algorithm on large-scale data sets, and is accurate, efficient, fast and low memory consumption.

【技术实现步骤摘要】
基于二值权重的图像哈希码训练模型算法及分类学习方法
本专利技术属于图像分类方法领域,具体涉及一种基于二值权重的图像哈希码训练模型及分类学习方法。
技术介绍
近年来,由于数码图像数量爆炸式增长和图像质量的大幅度提高,大规模视觉识别问题吸引了来自学术界和工业界的巨大的研究热情。成千上万类别的图像的分类问题通常使用常规分类器来进行大量计算,如k最近邻即k-NN,和支持向量机即SVM。在多类图像识别问题中,大量的分类器产生了巨额的计算和内存开销,并且在模型训练和部署阶段,大量的分类器将导致复杂性的飙升。试想对于一个有C个类别,每个类别有D维度的特征进行分类,最简单的线性模型也需要C*D个参数,在大规模数据中,不管是计算量还是内存开销上都是难以接受的。ImageNet数据集总共有21841类,当在一些顶级水平的图像特征,例如4096维的深度学习特征,进行实验的时候,8千万个参数需要被学习并且保存。这显然会降低训练的速率和测试时的效率。现实中的应用如工业界的图像检索引擎,都要求近乎实时地响应速度。因此,高效训练多类图像分类器还有很大空间需要提高。压缩二值哈希码-Compactbinaryhashcodes,利用哈希码对大规模数据集进行相似图像检索在学术界已经取得了显著的成功。在典型的监督学习中,算法通过最小化相同类别间的汉明距离的方式来优化哈希码。现实中,图像哈希码技术被广泛利用,正是由于其在大规模数据集上所耗内存小、有扎实的理论保证的特点。虽然哈希码技术在图像检索研究领域已经有了不菲的成果,但其对于大规模数据优化问题在机器学习和计算机视觉领域都还留有一些处于初级阶段的问题。简单来看,用一些很简单的算法例如k-NN投票就可以利用哈希码对图像进行分类。训练和测试数据集都可以通过哈希方程对其编码。一张新的图片可以通过它投影到的哈希桶中的哈希码的主要的类别来确定其分类。但是,因为哈希码基于图像搜索的目的来进行优化的,这样简单的策略难以保证其图像识别的高准确率。目前,解决图像分类的主流方法有利用哈希表达的非线性核SVM算法。这类算法首先选定了一系列哈希方程,将原始图像特征转化为二值码。最初的非线性核算法,如:RBFkernel,理论上被证明了通过内积的方式来逼近二值哈希码间的关系。这类方法突出的优点是双倍的:被要求的哈希码在原来特征维度上既可以呈弱线性的,同时对于非线性优化问题也可以转化为线性问题。但是,这类方法主要的缺点在于这类算法还是只能在常规的实数域上进行分类而不是基于二值特征。虽然它也可以直接应用于线性方法,但是二值码的潜在信息没有得到充分地利用。总的来说,图像哈希码学习算法在过去的几十年已经得到较多成果,大致可以分为两类:一、基于快速图像搜索的哈希算法。最近成为了计算机视觉研究领域的热门研究课题。数码摄影的普及使得数码图片数量的激增并促使了亿万级图像数据集的出现。高效的对目标图片进行相似性搜索是大规模数据集中的关键操作。LSH的开创性工作使得快速图像搜索有了新的发展方向并在理论上给予保证。一些典型的管道哈希码图像检索算法既可以通过无监督学习也可以从具有相似/不相似标签数据集中进行训练生成哈希方程。后者通常也被称为监督学习哈希算法,因为他经常通过相似/不相似标签来判断两个样本间的相似性。对于未知的图片,它通过对数据库中图片的哈希码进行快速对比,找到与之最相似的图片。利用哈希桶方法,可以在次线性时间复杂度下完成。这类代表性的算法有基于二值码重构的二值码嵌入重构-BianryReconstructiveEmbedding,最小损失哈希-MinimalLossHashing等。二、基于大规模图像优化的哈希算法。由于汉明距离能够很好地保留图像数据间的相似性,所以可以推导通过它能够模拟非线性内核间的关系。基于非线性内核来进行优化通常需要更大的空间来存储整个内核矩阵。这一特性使它难以应用于大规模数据集中。实数向量特征映射-Realvectorsbasedexplicitfeaturemapping用数据集内积函数逼近核函数的方法在一定程度上补救了这一问题。但是,高准确率的逼近往往要求高的维度,这样就超过了大多数学者的维度范围。最近一系列新的研究方法代替了用二值码逼近模拟非线性核方法,如:Muetal.2014;Li,Samorodnitsk;Hopcroft2013。其中,特别是Muetal,建立了一个随机子空间投影,将原始数据转换为紧凑的哈希比特。哈希码的内积本质上扮演了核函数的角色。因此,非线性内核支持向量机也可以转换成一个线性支持向量机,然后采用高效的线性计算器,如LibLinear。这些方法仅要求哈希码在原始的空间维度中呈弱线性,同时可以将非线性优化问题转换为线性问题。但是,他们有一个主要的缺点,这些方法仍然依赖于通过原始数据得到的分类器的二值特征。虽然它能够直接通过线性计算器来得到应用,但是二值码潜在的信息没有得到充分地利用。
技术实现思路
本专利技术的目的在于:解决现有的图像分类算法在大规模图像数据集中存在的内存占用过高、计算开销大、得到的分类效果欠佳等问题,提供能够在多种图像类别和高纬度场景下进行图像分类,提高算法在大规模数据集上的性能,精确、高效、快捷且低内存消耗的一种基于二值权重的图像哈希码训练模型及分类学习方法。本专利技术采用的技术方案如下:一种基于二值权重的哈希码图像训练模型,模型算法包括如下步骤:步骤1.1、选择损失函数,确定目标方程,并对分类器和训练图像特征进行二值编码;步骤1.2、对步骤1.1得到的分类器和训练图像特征的二值编码进行统一学习,更新训练图像特征哈希码与分类器二值码后优化步骤1.1所选损失函数的目标方程,并得到优化后的图像哈希码;步骤1.3、通过步骤1.2得到的优化后的图像哈希码和线性哈希方程求值哈希码公式,得到哈希码训练模型。进一步,所述步骤1.1中对分类器和训练图像特征进行二值编码为:令训练图像特征二值码为bi是原训练数据集中xi对应的r-bit的二值码,设一个线性哈希方程为:b=sgn(PTx)这里P是图像哈希转置矩阵;T是转置符号;d是图像x的维数;r是哈希码长度;分类器二值码为w。进一步,所述步骤1.2中更新训练图像特征哈希码与分类器二值码方法为:固定哈希码B,通过采用交替最小化更新的方式一行行依次迭代更新w,每一次更新wc的一个比特,c=1,...,C,同时保持其它r-1个比特不变;固定分类器二值码w,通过采用交替最小化更新的方式一行行依次迭代更新B,在每次迭代中,除了第k位的哈希码bk=[b1(k);...;bn(k)],剩余的r-1位的哈希码不变。进一步,所述步骤1.2中在采用交替最小化更新的方式更新图像特征哈希码与分类器二值码过程中采用比特顺序翻转方法解决其二元二次规划问题。一种应用基于二值权重的哈希码图像训练模型的分类学习方法,方法包括如下步骤:步骤2.1、待搜索图像通过基于二值权重的哈希码训练模型得到相应的哈希码,求出待搜索图像哈希码与分类器二值码之间的汉明距离;步骤2.2、在步骤2.1所得到的C个汉明距离中找最小值并得到最小汉明距离对应的分类器,即为待搜索图像所属类别。进一步,所述步骤2.1还包括得到分类器二值码的二值参数向量,分类器二值码矩阵WT为:这里wc∈{本文档来自技高网
...

【技术保护点】
1.一种基于二值权重的哈希码图像训练模型,其特征在于:模型算法包括如下步骤:步骤1.1、选择损失函数,确定目标方程,并对分类器和训练图像特征进行二值编码;步骤1.2、对步骤1.1得到的分类器和训练图像特征的二值编码进行统一学习,更新训练图像特征哈希码与分类器二值码后优化步骤1.1所选损失函数的目标方程,并得到优化后的图像哈希码;步骤1.3、通过步骤1.2得到的优化后的图像哈希码和线性哈希方程求值哈希码公式,得到哈希码训练模型。

【技术特征摘要】
1.一种基于二值权重的哈希码图像训练模型,其特征在于:模型算法包括如下步骤:步骤1.1、选择损失函数,确定目标方程,并对分类器和训练图像特征进行二值编码;步骤1.2、对步骤1.1得到的分类器和训练图像特征的二值编码进行统一学习,更新训练图像特征哈希码与分类器二值码后优化步骤1.1所选损失函数的目标方程,并得到优化后的图像哈希码;步骤1.3、通过步骤1.2得到的优化后的图像哈希码和线性哈希方程求值哈希码公式,得到哈希码训练模型。2.根据权利要求1所述的一种基于二值权重的哈希码图像训练模型,其特征在于:所述步骤1.1中对分类器和训练图像特征进行二值编码为:令训练图像特征二值码为bi是原训练数据集中xi对应的r-bit的二值码,设一个线性哈希方程为:b=sgn(PTx)这里P是图像哈希转置矩阵;T是转置符号;d是图像x的维数;r是哈希码长度;分类器二值码为w。3.根据权利要求1所述的一种基于二值权重的哈希码图像训练模型,其特征在于:所述步骤1.2中更新训练图像特征哈希码与分类器二值码方法为:固定哈希码B,通过采用交替最小化更新的方式一行行依次迭代更新w,每一次更新wc的一个比特,c=1,...,C,同时保持其它r-1个比特不变;固定分类器二值码w,通过采用交替最小化更新的方式一行行依次迭代更新B...

【专利技术属性】
技术研发人员:沈复民
申请(专利权)人:成都考拉悠然科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1