【技术实现步骤摘要】
基于计算机视觉的图书图像检索方法
[0001]本专利技术涉及计算机视觉
,具体涉及基于计算机视觉的图书图像检索方法。
技术介绍
[0002]随着数字化技术的发展和互联网技术的不断进步,各行业都向着数字化的方向不断进步。在互联网技术的推动下,各大图书馆也都推出了数字化的图书管理系统。然而,由于图书种类繁杂,信息更新速度较快,读者如何从这些海量的信息中检索出所需要的信息已成为一个重要的研究课题。此外,读者对图书检索的要求也在提高,除了图书的一些基本信息,还需要了解图书的相关资源,并且希望能够及时、快速地得到反馈。
[0003]图书检索是为了获取尽可能准确的图书信息,现有方法是输入待检索图书的书名,得到该图书在图书数据库中的所有信息,该方法在有些情况下是不适用的。当遇到生僻字或看不懂的书名,就无法采用这种方法获取图书的信息。
技术实现思路
[0004]为了解决现有图书检索方法存在适用范围不广的问题,本专利技术的目的在于提供一种基于计算机视觉的图书图像检索方法,所采用的技术方案具体如下:
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于计算机视觉的图书图像检索方法,其特征在于,该方法包括以下步骤:获取待检索图书封面的RGB图像,根据待检索图书封面的RGB图像,得到待检索图书封面对应的语义向量,根据所述待检索图书封面对应的语义向量,得到待检索图书的类别;根据待检索图书封面的灰度图,得到待检索图书封面的文字梯度幅值图和文字梯度方向量化图;将待检索图书封面的RGB图像、待检索图书封面的文字梯度幅值图和待检索图书封面对的文字梯度方向量化图输入到待检索图书所属类别的度量学习网络中,得到待检索图书封面对应的嵌入向量;根据所述待检索图书封面对应的嵌入向量,得到待检索图书封面的低维投影点,将所述待检索图书封面的低维投影点与其所属类别数据库中图书封面的低维投影点进行匹配,得到待检索图书的检索结果。2.根据权利要求1所述的一种基于计算机视觉的图书图像检索方法,其特征在于,所述根据待检索图书封面的灰度图,得到待检索图书封面的文字梯度幅值图和文字梯度方向量化图,包括:获取待检索图书封面的灰度图中各像素点在x方向上的卷积和在y方向上的卷积,根据所述待检索图书封面的灰度图中各像素点在x方向上的卷积和在y方向上的卷积,计算待检索图书封面各像素点的梯度幅值和梯度方向;根据待检索图书封面各像素点的梯度幅值,得到待检索图书封面的梯度幅值图;根据待检索图书封面各像素点的梯度方向,得到待检索图书封面的梯度方向量化图;获取待检索图书封面的文本位置图,根据所述待检索图书封面的文本位置图、待检索图书封面的梯度幅值图和待检索图书封面的梯度方向量化图,得到待检索图书封面的文字梯度幅值图和文字梯度方向量化图。3.根据权利要求2所述的一种基于计算机视觉的图书图像检索方法,其特征在于,所述获取待检索图书封面的文本位置图,包括:对待检索图书封面的灰度图进行归一化处理,将归一化处理后的待检索图书封面的灰度图输入到语义提取网络中,得到待检索图书封面的文本位置概率图;对待检索图书封面的文本位置概率图进行argmax操作,得到待检索图书封面的文本位置图。4.根据权利要求1所述的一种基于计算机视觉的图书图像检索方法,其特征在于,度量学习网络的训练过程,包括:将同类别图书封面的RGB图像输入到...
【专利技术属性】
技术研发人员:王爱玲,花开瑞,刘岩,兰晓霞,董敏红,
申请(专利权)人:郑州轻工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。