一种基于深度学习的图书定位和识别方法技术

技术编号：28146110 阅读：14 留言：0更新日期：2021-04-21 19:30

本发明专利技术公开了一种基于深度学习的图书定位和识别方法，一种基于深度学习的图书定位和识别方法，包括以下步骤：步骤1、获取书架图像；步骤2、识别书架图像中每个图书的位置信息；步骤3、提取每个图书的特征信息；根据图书特征信息，搜索出图书特征信息对应的图书信息。本发明专利技术使用图像识别技术实现对图书的盘点。明使用图像识别技术实现对图书的盘点。明使用图像识别技术实现对图书的盘点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的图书定位和识别方法

[0001]本专利技术属于图像识别
，尤其涉及一种基于深度学习的图书定位和识别方法。

技术介绍

[0002]图书在书架上的定位和检索在图书馆信息管理系统中起着重要的作用。为了能够精确的定位图书的位置和相关信息，方便图书馆的盘点，传统上一般采用RFID标签的方法(如专利208172824U)来对图书进行识别。虽然RFID极大的减少了工作人员盘点的工作量，但是其具有很多缺点，首先在于RFID标签的成本过高，因为每本图书需要配备一个RFID标签，贴标签和输入信息需要花费大量的时间，其次是标签之间容易互相干扰，所以存在定位不准确和识别率不高的问题。为了解决这个问题，有效的降低图书盘点的成本和工作量，本专利技术中引入了深度学习和人工智能的方法，来有效的解决RFID既有的缺陷。

技术实现思路

[0003]本专利技术所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于深度学习的图书定位和识别方法，使用图像识别技术实现对图书的盘点。
[0004]为解决上述技术问题，本专利技术采用的技术方案是：一种基于深度学习的图书定位和识别方法，包括以下步骤：
[0005]步骤1、获取书架图像；
[0006]步骤2、识别书架图像中每个图书的位置信息；
[0007]步骤3、提取每个图书的特征信息；根据图书特征信息，搜索出图书特征信息对应的图书信息。
[0008]进一步地，所述步骤2，包括以下步骤：
[0009]调取预训练好的Mask R...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的图书定位和识别方法，其特征在于：包括以下步骤：步骤1、获取书架图像；步骤2、识别书架图像中每个图书的位置信息；步骤3、提取每个图书的特征信息；根据图书特征信息，搜索出图书特征信息对应的图书信息。2.按照权利要求1所述的一种基于深度学习的图书定位和识别方法，其特征在于：所述步骤2，包括以下步骤：调取预训练好的Mask R
‑
CNN深度学习模型；所述Mask R
‑
CNN深度学习模型为预先经过以下操作后的模型：修改所述Mask R
‑
CNN深度学习模型最后一层的全连接层或1x1的卷积层，使Mask R
‑
CNN深度学习模型的输出为单种物体的坐标和概率；使用调取的Mask R
‑
CNN深度学习模型识别书架图像中每个图书书脊的图像的位置信息。3.按照权利要求2所述的一种基于深度学习的图书定位和识别方法，其特征在于：所述预训练好的Mask R
‑
CNN深度学习模型，训练时包括以下步骤：调取已经过修改的Mask R
‑
CNN深度学习模型；调取合成的训练数据，所述训练数据为书架图像，该书架图像中的每个图书书脊的图像均标记有坐标信息，每个所述书脊的形状对应...

【专利技术属性】
技术研发人员：张校捷，
申请(专利权)人：上海书山智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人