一种基于语义和内容的快速图像检索方法及装置制造方法及图纸

技术编号：21547946 阅读：28 留言：0更新日期：2019-07-06 21:28

为了解决现有图像检索方法针对大型数据库检索速度较慢的问题，提供了一种基于语义和内容的快速图像检索方法及装置，属于图像处理技术领域。本发明专利技术包括：构建语义分割网络；将离线数据库中所有图像输入语义分割网络，得到每幅图像的一种或多种语义标签；将语义标签全部相同的图像归为一类，得到多个语义数据库，将每个语义数据库对应的语义标签转换为唯一数字标签，并采用数字标签对相应的语义数据库进行标记；将待检索图像输入语义分割网络，得到待检索图像的语义标签，并转换为数字标签；确定与待检索图像具有相同数字标签的语义数据库，并基于内容检索的方式，在确定的语义数据库中检索与待检索图像相匹配的图像。

A Fast Image Retrieval Method and Device Based on Semantic and Content

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义和内容的快速图像检索方法及装置
本专利技术涉及一种视觉定位中的图像检索方法，特别涉及一种基于语义和内容的快速图像检索方法，属于图像处理

技术介绍
室内视觉定位技术中的在线阶段需要对用户提供的待定位图像进行快速检索，在定位数据库中找到其匹配图像，从而进行精确定位。现有的图像检索算法大多是对数据库中图像与用户输入图像进行特征提取与比较，以寻找最小欧式距离的匹配特征向量。然而随着数据库的增大，提取的特征数目逐渐增多，在线阶段寻找匹配特征向量的过程需要消耗大量时间，不能满足在线定位的实时性。因此需要一种在确保检索精度条件下的快速检索算法，从而提高在线阶段寻找匹配图像的检索速度。
技术实现思路
为了解决现有图像检索方法针对大型数据库检索速度较慢的问题，提供了一种基于语义和内容的快速图像检索方法及装置。本专利技术的基于语义和内容的快速图像检索方法，所述快速图像检索方法包括：步骤一、构建语义分割网络；步骤二、将离线数据库中所有图像输入语义分割网络，得到每幅图像的一种或多种语义标签；步骤三、将语义标签全部相同的图像归为一类，得到多个语义数据库，将每个语义数据库对应的语义标签转换为唯一数字标签，并采用数字标签对相应的语义数据库进行标记；步骤四、将待检索图像输入语义分割网络，得到待检索图像的语义标签；步骤五、将待检索图像的语义标签转换为数字标签；步骤六、确定与待检索图像具有相同数字标签的语义数据库，并基于内容检索的方式，在确定的语义数据库中检索与待检索图像相匹配的图像。优选的是，将将单张图像Itest的一种或多种语义标签转化成唯一数字标签：l＝Λ·Ω转化向量...

【技术保护点】
1.基于语义和内容的快速图像检索方法，其特征在于，所述快速图像检索方法包括：步骤一、构建语义分割网络；步骤二、将离线数据库中所有图像输入语义分割网络，得到每幅图像的一种或多种语义标签；步骤三、将语义标签全部相同的图像归为一类，得到多个语义数据库，将每个语义数据库对应的语义标签转换为唯一数字标签，并采用数字标签对相应的语义数据库进行标记；步骤四、将待检索图像输入语义分割网络，得到待检索图像的语义标签；步骤五、将待检索图像的语义标签转换为数字标签；步骤六、确定与待检索图像具有相同数字标签的语义数据库，并基于内容检索的方式，在确定的语义数据库中检索与待检索图像相匹配的图像。

【技术特征摘要】
1.基于语义和内容的快速图像检索方法，其特征在于，所述快速图像检索方法包括：步骤一、构建语义分割网络；步骤二、将离线数据库中所有图像输入语义分割网络，得到每幅图像的一种或多种语义标签；步骤三、将语义标签全部相同的图像归为一类，得到多个语义数据库，将每个语义数据库对应的语义标签转换为唯一数字标签，并采用数字标签对相应的语义数据库进行标记；步骤四、将待检索图像输入语义分割网络，得到待检索图像的语义标签；步骤五、将待检索图像的语义标签转换为数字标签；步骤六、确定与待检索图像具有相同数字标签的语义数据库，并基于内容检索的方式，在确定的语义数据库中检索与待检索图像相匹配的图像。2.如权利要求1所述的基于语义和内容的快速图像检索方法，其特征在于，将将单张图像Itest的一种或多种语义标签转化成唯一数字标签：l＝Λ·Ω转化向量Λ＝[20,21,…,2c]，c表示表示语义类别的数量，语义判别向量Ω＝[ω1,ω2,…,ωc]T，其中：Si表示语义标签，语义数据库为S＝[S1,S2,…,Sc]。3.根据权利要求2所述的基于语义和内容的快速图像检索方法，其特征在于，所述语义分割网络包括全卷积网络、区域候选网络和感兴趣区域子网；全卷积网络根据输入的图像，输出该图像的特征图；区域候选网络根据全卷积网络输出的特征图，生成多个候选区域；感兴趣区域子网根据全卷积网络输出的特征图，生成每个语义类别对应的k×k个位置敏感分数图，每个位置敏感分数图有c+1个通道输出；感兴趣区域子网的池化层利用候选区域对每个位置敏感分数图进行池化操作，并输出的c+1维特征图按维度求和得到c+1维的向量；将得到的c+1维的向量代入到多项逻辑斯蒂回归公式中，获得该候选区域中的目标属于每个类别的概率，并按照超过阈值φ且最大的概率将其归类，确定输入图像的语义标签。4.根据权利要求3所述的基于语义和内容的快速图像检索方法，其特征在于，所述步骤一中，构建语义分割网络的损失函数L包括：分类损失函...

【专利技术属性】
技术研发人员：马琳，戴进，谭学治，何晨光，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人