【技术实现步骤摘要】
本专利技术涉及图像检索,具体涉及一种基于全局描述符正交融合的单阶段图像检索方法及装置。
技术介绍
1、图像检索是计算机视觉和多媒体领域的一个长期研究课题。它将一张描述了用户需求的查询图像,通过分析视觉内容,在一个很大的图像库中搜索语义上匹配的或者相似的图像。随着目前图像和视频数据的数量呈指数级增长,开发适当的信息系统,有效地管理如此庞大的图像集是至关重要的,而图像检索是其中必不可少的技术之一。随着图像的数量指数增加,图像检索难以在较短的时间内从海量的图像库中检索出使用者所需要的图像,而很多实时性较高的领域需要在短时间内完成检索任务,否则后续的任务将无法开展。此外当图像的质量较差时图像检索的准确度会比较低,难以完成实际工作的要求。
2、为了解决图像检索的准确率和速度的问题,亟需提出一种准确率高、速度快的图像检索算法。自从1999年david g.lowe提出sift算法以后,sift就成为了图像检索特征提取的主流方法。在2012年krizhevsky提出alexnet神经网络模型以后,图像检索特征提取的重心开始从sitf向卷积
...【技术保护点】
1.一种基于全局描述符正交融合的单阶段图像检索方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述预先训练的特征提取模型包括:ResNet50网络、注意力层、激活层、GeM池化层、最大池化层、平均池化层和正交融合层;
3.如权利要求2所述的方法,其特征在于,所述ResNet50网络去掉下采样层。
4.如权利要求2所述的方法,其特征在于,所述激活层的激活函数为ReLu激活函数。
5.如权利要求2所述的方法,其特征在于,所述注意力层采用多头注意力机制,所述多头注意力机制使用四个注意力头。
【技术特征摘要】
1.一种基于全局描述符正交融合的单阶段图像检索方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述预先训练的特征提取模型包括:resnet50网络、注意力层、激活层、gem池化层、最大池化层、平均池化层和正交融合层;
3.如权利要求2所述的方法,其特征在于,所述resnet50网络去掉下采样层。
4.如权利要求2所述的方法,其特征在于,所述激活层的激活函数为relu激活函数。
5.如权利要求2所述的方法,其特征在于,所述注意力层采用多头注意力机制,所述多头注意力机制使用四个注意力头。
6.如权利要求2所述的方法,其特征在于,所述预先训练的特征提取模型采用分类损失函数和特征损失函数计算模型的损失,采用随机梯度下降方法进行参数更新。
7.如权利要求2所述的方法,其特征在于,所述正交融合层,用于将所述gem池化层对应的批量归一化层输出的全局...
【专利技术属性】
技术研发人员:王家凯,黄佩卓,李勇乐,刘洋,盛爽,陈佳琦,苑鲁峰,
申请(专利权)人:国家电网有限公司大数据中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。