一种海量图像侵权检索方法、系统及其计算机可读存储介质技术方案

技术编号：23704951 阅读：31 留言：0更新日期：2020-04-08 11:11

本发明专利技术提供了一种海量图像侵权检索方法、系统及其计算机可读存储介质，其方法步骤包括：S1生成词袋模型：提取模板图像的SIFT特征点，经聚类处理获取视觉词汇，建立词袋模型；S2制作训练集：计算各视觉词汇的反文档权重，定位出符合预设阀值的SIFT特征点，以对应裁剪模板图像获取原始训练数据；S3训练神经网络：采用步骤S2的原始训练数据，依据综合度量学习和哈希学习方法训练CNN网络，生成二进制特征；S4检索判断：利用步骤S1的词袋模型构建倒排索引系统，遍历待检索图像中各视觉词汇对应的条目，计算二进制特征间的汉明距离，根据预设阈值判断是否匹配，并根据累计匹配给出侵权系数。进而提高侵权图像检索速度，同时保证较高的准确率。

A massive image infringement retrieval method, system and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种海量图像侵权检索方法、系统及其计算机可读存储介质
本专利技术涉及计算机视觉领域，具体地说，涉及一种基于SIFT和局部二进制特征的图像侵权检索方法、系统及其计算机可读存储介质。
技术介绍
手工局部特征对于图像检索任务至关重要，在以深度学习为代表的全局特征表达出现前占据图像检索的主流方法。局部特征与词袋模型的结合提高了检索的速度和准确率，在图像规模较小的情况下，词袋模型包含较少的视觉词汇，一般采用局部特征聚合得到全局特征的方法，例如VALD；在图像规模较大时，视觉词汇较多，一般采用倒排索引系统，利用视觉词汇的直接匹配作为检索依据。对于侵权特征检索，全局特征表现不佳，一个主要原因是某些侵权类型例如裁剪和拼接会大幅影响全局特征，现阶段主流方法为利用局部特征的精准匹配来筛选侵权图像。为了实现局部特征的精准匹配，现阶段主流方法都是采用几何验证的方法滤除掉错匹配.如专利号：CN201710267385.1，提供了一种图像检索系统，该技术方案主要记载了包括：查询图像样本、提取图像库中的第一局部特征、防误判模块、提取图像库中的第二局部特征、安全控制模块、图像检索和图像安全显示器；本专利技术通过关键词和标记的运用，预先将数据库划分为多个子数据库，检索时先在相关度高的子数据库中进行检索，减少了计算量，提高了运算速度；基于单词词汇包表示图像时，提出了加权表示和第一视觉相似度，减少了时间开销；基于特征组合表示图像时，利用了局部特征之间的空间包含关系，提出将相关的局部特征组合在一起以增强其视觉表达能力；该特征组合不但具有良好...

【技术保护点】
1.一种海量图像侵权检索方法，步骤包括：/nS1生成词袋模型：提取模板图像的SIFT特征点，经聚类处理获取视觉词汇，建立词袋模型；/nS2制作训练集：计算各视觉词汇的反文档权重，定位出符合预设阀值的SIFT特征点，以对应裁剪模板图像获取原始训练数据；/nS3训练神经网络：采用步骤S2的原始训练数据，依据综合度量学习和哈希学习方法训练CNN网络，生成二进制特征；/nS4检索判断：利用步骤S1的词袋模型构建倒排索引系统，遍历待检索图像中各视觉词汇对应的条目，计算二进制特征间的汉明距离，根据预设阈值判断是否匹配，并根据累计匹配给出侵权系数。/n

【技术特征摘要】
1.一种海量图像侵权检索方法，步骤包括：
S1生成词袋模型：提取模板图像的SIFT特征点，经聚类处理获取视觉词汇，建立词袋模型；
S2制作训练集：计算各视觉词汇的反文档权重，定位出符合预设阀值的SIFT特征点，以对应裁剪模板图像获取原始训练数据；
S3训练神经网络：采用步骤S2的原始训练数据，依据综合度量学习和哈希学习方法训练CNN网络，生成二进制特征；
S4检索判断：利用步骤S1的词袋模型构建倒排索引系统，遍历待检索图像中各视觉词汇对应的条目，计算二进制特征间的汉明距离，根据预设阈值判断是否匹配，并根据累计匹配给出侵权系数。

2.根据权利要求1所述的海量图像侵权检索方法，其中步骤S1中，所述提取模板图像的SIFT特征点步骤包括：对所述模板图像进行保持宽高比缩放处理，以控制尺寸来限制SIFT特征点提取数。

3.根据权利要求1所述的海量图像侵权检索方法，其中步骤S1中，所述经聚类处理获取视觉词汇步骤包括：对提取的SIFT特征点归集成特征集，并利用AKM聚类算法得到聚类中心，以每一个聚类中心视为一个视觉词汇，建立词袋模型。

4.根据权利要求1所述的海量图像侵权检索方法，其中步骤S2中，所述视觉词汇的反文档权重计算步骤包括：将包含有K个视觉词汇的词袋模型{c1，c2，...cK}分别进行计算：

并选择反文档权重最小的若干词汇。

5.根据权利要求1所述的海量图像侵权检索方法，其中步骤S2中，还包括侵权数据生成处理步骤：对根据定位出的SIFT特征点所对应裁剪出的图像块进行异常处理。

6.根据权利要求5所述的海量图像侵权检索方法，其中步骤S3中，所述度量学习步骤包括：采用三元组损失作为损失函数，...

【专利技术属性】
技术研发人员：朱向军，吴敏，刘锋，吴冠勇，
申请(专利权)人：上海冠勇信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人