基于二值权重的图像哈希码训练模型算法及分类学习方法技术

技术编号：18972800 阅读：30 留言：0更新日期：2018-09-19 03:48

本发明专利技术公开了一种基于二值权重的哈希码图像训练模型，模型算法步骤包括：选择损失函数，确定目标方程，并对分类器和训练图像特征进行二值编码；对二值编码进行统一学习，更新二值码，优化损失函数；推导哈希码训练模型。还公开了一种应用基于二值权重的哈希码图像训练模型的分类学习方法，步骤包括：待搜索图像通过基于二值权重的哈希码训练模型得到哈希码，求出哈希码与分类器二值码之间的汉明距离；在汉明距离中查找最小汉明距离，并得到其对应的分类器，即为待搜索图像所属类别。本发明专利技术能够在多种图像类别和高纬度场景下进行图像分类，提高算法在大规模数据集上的性能，精确、高效、快捷且低内存消耗。

Image hash training model algorithm and classified learning method based on two valued weight

The invention discloses a hash code image training model based on binary weight. The model algorithm steps include: selecting loss function, determining target equation, and binary coding of classifier and training image features; unifying binary coding, updating binary code, optimizing loss function; deriving hash code training; Model. Also disclosed is a classification learning method using a hash code image training model based on binary weight. The steps include: the hash code is obtained from the hash code training model based on binary weight of the image to be searched, the Hamming distance between the hash code and the binary code of the classifier is calculated, and the minimum Hamming distance is found in the Hamming distance. And get its corresponding classifier, that is, the category to be searched. The invention can classify images in a variety of image categories and high latitude scenes, improve the performance of the algorithm on large-scale data sets, and is accurate, efficient, fast and low memory consumption.

全部详细技术资料下载

【技术实现步骤摘要】
基于二值权重的图像哈希码训练模型算法及分类学习方法
本专利技术属于图像分类方法领域，具体涉及一种基于二值权重的图像哈希码训练模型及分类学习方法。
技术介绍
近年来，由于数码图像数量爆炸式增长和图像质量的大幅度提高，大规模视觉识别问题吸引了来自学术界和工业界的巨大的研究热情。成千上万类别的图像的分类问题通常使用常规分类器来进行大量计算，如k最近邻即k-NN，和支持向量机即SVM。在多类图像识别问题中，大量的分类器产生了巨额的计算和内存开销，并且在模型训练和部署阶段，大量的分类器将导致复杂性的飙升。试想对于一个有C个类别，每个类别有D维度的特征进行分类，最简单的线性模型也需要C*D个参数，在大规模数据中，不管是计算量还是内存开销上都是难以接受的。ImageNet数据集总共有21841类，当在一些顶级水平的图像特征，例如4096维的深度学习特征，进行实验的时候，8千万个参数需要被学习并且保存。这显然会降低训练的速率和测试时的效率。现实中的应用如工业界的图像检索引擎，都要求近乎实时地响应速度。因此，高效训练多类图像分类器还有很大空间需要提高。压缩二值哈希码-Compactbinaryhashcodes，利用哈希码对大规模数据集进行相似图像检索在学术界已经取得了显著的成功。在典型的监督学习中，算法通过最小化相同类别间的汉明距离的方式来优化哈希码。现实中，图像哈希码技术被广泛利用，正是由于其在大规模数据集上所耗内存小、有扎实的理论保证的特点。虽然哈希码技术在图像检索研究领域已经有了不菲的成果，但其对于大规模数据优化问题在机器学习和计算机视觉领域都还留有一些处于初级阶段...

【技术保护点】
1.一种基于二值权重的哈希码图像训练模型，其特征在于：模型算法包括如下步骤：步骤1.1、选择损失函数，确定目标方程，并对分类器和训练图像特征进行二值编码；步骤1.2、对步骤1.1得到的分类器和训练图像特征的二值编码进行统一学习，更新训练图像特征哈希码与分类器二值码后优化步骤1.1所选损失函数的目标方程，并得到优化后的图像哈希码；步骤1.3、通过步骤1.2得到的优化后的图像哈希码和线性哈希方程求值哈希码公式，得到哈希码训练模型。

【技术特征摘要】
1.一种基于二值权重的哈希码图像训练模型，其特征在于：模型算法包括如下步骤：步骤1.1、选择损失函数，确定目标方程，并对分类器和训练图像特征进行二值编码；步骤1.2、对步骤1.1得到的分类器和训练图像特征的二值编码进行统一学习，更新训练图像特征哈希码与分类器二值码后优化步骤1.1所选损失函数的目标方程，并得到优化后的图像哈希码；步骤1.3、通过步骤1.2得到的优化后的图像哈希码和线性哈希方程求值哈希码公式，得到哈希码训练模型。2.根据权利要求1所述的一种基于二值权重的哈希码图像训练模型，其特征在于：所述步骤1.1中对分类器和训练图像特征进行二值编码为：令训练图像特征二值码为bi是原训练数据集中xi对应的r-bit的二值码，设一个线性哈希方程为：b＝sgn(PTx)这里P是图像哈希转置矩阵；T是转置符号；d是图像x的维数；r是哈希码长度；分类器二值码为w。3.根据权利要求1所述的一种基于二值权重的哈希码图像训练模型，其特征在于：所述步骤1.2中更新训练图像特征哈希码与分类器二值码方法为：固定哈希码B，通过采用交替最小化更新的方式一行行依次迭代更新w，每一次更新wc的一个比特，c＝1，...，C，同时保持其它r-1个比特不变；固定分类器二值码w，通过采用交替最小化更新的方式一行行依次迭代更新B...

【专利技术属性】
技术研发人员：沈复民，
申请(专利权)人：成都考拉悠然科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人