【技术实现步骤摘要】
一种书脊分割与文字识别系统及方法
本专利技术专利属于图书馆馆藏书目管理领域,具体涉及一种书脊区域分割与文字识别系统及方法。
技术介绍
计算机视觉是指利用摄像头和处理器对对象特征进行识别,提取和跟踪,最终,经过人性化处理获得所需的图像信息。而近几年来,作为机器学习中发展最为迅速的一个领域,深度学习为计算机视觉带来了更加广阔的应用和发展前景。图像处理是深度学习最早尝试应用的领域。它通过建立起与大脑神经网络相似的分层模型,逐层提取输入图像信息的特征映射,建立起从低级数据信息到高级语义的对应关系,最终实现了对图像的智能化处理。现已广泛应用在手写识别,证件信息审核、车牌识别等领域,其核心任务是文字检测和文字识别。在现有图书馆书籍管理系统中,图书管理还是大量依赖于人工,而基于深度学习的整体书籍管理解决方案目前还没有人提出,书脊分割与文字识别的主要问题是如何快速准确地对书脊进行分割,对于图书馆场景中的各种复杂情况,书脊分割需要有较好的稳定性,采用深度学习的方式可以快速地进行书脊分割,然而由于照片拍摄的透射效果使得即使是摆正的书脊, ...
【技术保护点】
1.一种书脊分割与文字识别方法,其特征在于:包括:/n步骤一、利用图像采集系统获取书脊图像image;/n步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img
【技术特征摘要】
1.一种书脊分割与文字识别方法,其特征在于:包括:
步骤一、利用图像采集系统获取书脊图像image;
步骤二、将书脊图像image传入神经网络框架DarkNet中进行书脊分割,得到N个单书脊图像img1,img2…imgN;对每一个单书脊图像imgi执行如下步骤:(1)使用快速线检测算法对分割后的单书脊图像imgi进行直线检测得到直线组lines;(2)使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines;(3)计算拟合直线组fitted_lines所有直线的角度平均值rotation_angle,并使用该平均值对单个书脊图像和直线组进行透射旋转变换得到旋转书脊图像rotated_imgi和旋转直线组rotated_lines;(4)使用卷积递归神经网络CRNN对旋转书脊图像rotated_imgi进行文字检测得到文字区域和文字内容;(5)使用文字区域对旋转直线组rotated_lines进行滤波,去除与文字区域相交的直线;(6)在滤波后的旋转直线组rotated_lines中找到距离旋转书脊图像rotated_imgi中心左侧最近的直线line1,距离旋转书脊图像rotated_imgi中心右侧最近的直线line2,并使用line1,line2对旋转书脊图像rotated_imgi进行裁剪;(7)使用直线line1和直线line2对文字区域与文字内容滤波,保留位置包含在line1,line2之间的文字识别结果;
步骤三、对书脊的文字识别结果进行数据库匹配;
步骤四、存储识别结果,按标记显示书脊图像。
2.根据权利1所述的书脊分割与文字识别方法,其特征在于:所述使用线拼接算法对直线组lines进行拟合,得到长度大于阈值的拟合直线组fitted_lines的具体步骤如下:
步骤1:调用快速...
【专利技术属性】
技术研发人员:孙大洋,许文巍,张有丰,
申请(专利权)人:吉林大学,
类型:发明
国别省市:吉林;22
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。