一种训练和计算相似性哈希码的神经网络方法技术

技术编号：27846700 阅读：19 留言：0更新日期：2021-03-30 12:56

本发明专利技术涉及计算机处理技术领域，具体涉及一种训练和计算相似性哈希码的神经网络方法，旨在解决现有技术中在实际情况中效果不佳的问题，其技术要点在于：包含以下步骤：S1：使用一个神经网络将一个高维空间的向量z映射为低维空间的向量x；S2：确定该神经网络的参数θ；S3：使用神经网络f(*|θ)计算相似性哈希码，即强迫输出的值只取0/1二值。本申请所提供的一种训练和计算相似性哈希码的神经网络方法，解决了只采用线性变换时效果不佳的问题，适用范围更加广泛，不只局限于图像，处理图像时不依赖于手工设计的SIFT或SURF特征，速度更快，而且可以使用GPU进一步加速。且可以使用GPU进一步加速。且可以使用GPU进一步加速。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练和计算相似性哈希码的神经网络方法

[0001]本专利技术涉及计算机处理
，具体涉及一种训练和计算相似性哈希码的神经网络方法。

技术介绍

[0002]2010年以色列研究学者发表的论文”The Video Genome”首次提出了视频基因的概念。该论文提出了对于一张图片(或者图像帧)首先提取它的SIFT特征，SIFT特征是一个128维的向量。通过对大量的图像抽取SIFT特征就可以得到大量的SIFT特征点数据，然后利用这些SIFT特征数据通过聚类算法找到 2048个聚类中心，将聚类中心作为量化中心点。
[0003]然后对于任意一副图像，都可以将SIFT特征向量量化到其中一个聚类中心点。论文中提出将图像分为左上、右上、左下、右下四个区域，在每一个区域中，对落入每一个聚类中心点的SIFT特征进行计数就可以得到2048维的特征向量，四个区域合起来可以得到2048*4＝8192维的特征向量，这个特征向量就称为图像的基因码。
[0004]下一步计算相似性哈希码是最为关键的一步。作者提出要将该8192维的高维特征向量降低为64维相似性哈希码，所谓相似性哈希码是指如果两幅图像是相似的，那么它们俩的相似性哈希码应之间的汉明距离应小于d0，如果两幅图像不相似它们的哈希码的汉明距离应大于d0。论文作者提出的方法是用一个线性变换将8192维向量降低至64维向量，如下面公式所示：
[0005]x＝sign(Az+b)
ꢀꢀꢀ
(1)
[0006]其中z表示8192维的高维特征向量，x...

【技术保护点】

【技术特征摘要】
1.一种训练和计算相似性哈希码的神经网络方法，包含以下步骤：S1：使用一个神经网络将一个高维空间的向量z映射为低维空间的向量x；S2：确定该神经网络的参数θ；S3：使用神经网络f(*|θ)计算相似性哈希码，即强迫输出的值只取0/1二值。2.根据权利要求1所述的训练和计算相似性哈希码的神经网络方法，其特征在于：包含以下公式：其中，公式中：表示对向量x的所有纬度求和得到一个标量。将输出的p作为向量z和z
/
是否相似的概率；所述α是一个常数，用来调控sigmoid函数在0附近的斜率；训练公式(3)所示的神经网络，采用交叉熵作为目标函数，即：当z和z...

【专利技术属性】
技术研发人员：张勇，朱立松，
申请(专利权)人：央视国际网络无锡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人