一种基于OCR的店头文字识别方法及系统技术方案

技术编号：28150628 阅读：35 留言：0更新日期：2021-04-21 19:42

本发明专利技术提供一种基于OCR的店头文字识别方法及系统，其中方法包括：获取含有店头文字的图片，对所述图片进行预处理，得到含有店头文字的第一图像；其中，所述预处理包括：去噪处理、角度矫正及增强处理；对所述第一图像进行文本区域检测，得到所述第一图像的文本区域数量及位置信息；根据所述第一图像的文本区域数量及位置信息进行裁剪，得到仅含有文本信息的第二图像；对所述第二图像中的文本信息进行文字识别，得到输出文字信息；对所述文字信息进行筛选，输出目标文字信息。本发明专利技术可实现图像中店头实时自动化检测与店头名称识别，支持多方向、多版本字体的识别。本发明专利技术支持单张/批量店头图像处理，支持同步/异步店头信息识别。支持同步/异步店头信息识别。支持同步/异步店头信息识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于OCR的店头文字识别方法及系统

[0001]本专利技术涉及光学字符识别
，特别是涉及一种基于OCR的店头文字识别方法及系统。

技术介绍

[0002]在快消行业中，快消企业生产的商品在线下主要依靠终端门店来进行售卖，对于大型快消企业，在全国各个区域的终端门店数量与店铺名称的信息非常重要。
[0003]一直以来，快消企业获取终端门店名称的传统做法是依靠不同区域的业务员，在进行门店拜访巡查时手动录入门店名称，这样不仅影响工作效率，且验证获取信息的正确性同样需要投入人力，成本较高，很多快消企业只能采取抽样验证的方式进行校验，所以，即使获取到的信息中存在不准确的或者虚假的，也很难被查出，造成企业对市场的错误判断。

技术实现思路

[0004]本专利技术提供一种基于OCR的店头文字识别方法及系统，可以对手机、相机等电子设备拍摄的店头信息进行识别，将识别到的店铺名称信息直接上传到快消企业的业务数据系统，在保证信息准确性的同时极大地节省了人力资源。
[0005]本专利技术一个实施例提供一种基于OC...

【技术保护点】

【技术特征摘要】
1.一种基于OCR的店头文字识别方法，其特征在于，包括：获取含有店头文字的图片，对所述图片进行预处理，得到含有店头文字的第一图像；其中，所述预处理包括：去噪处理、角度矫正及增强处理；对所述第一图像进行文本区域检测，得到所述第一图像的文本区域数量及位置信息；根据所述第一图像的文本区域数量及位置信息进行裁剪，得到仅含有文本信息的第二图像；对所述第二图像中的文本信息进行文字识别，得到输出文字信息；对所述文字信息进行筛选，输出目标文字信息。2.如权利要求1所述的一种基于OCR的店头文字识别方法，其特征在于，所述对所述第一图像进行文本区域检测之前，还包括：通过基于深度学习技术对店头图像和标注数据进行训练得到的检测模型对所述第一图像进行检测，在判断所述第一图像含有至少有一个店头文字时，执行对所述第一图像进行文本区域检测。3.如权利要求2所述的一种基于OCR的店头文字识别方法，其特征在于，所述在判断所述第一图像含有至少有一个店头文字时，具体地：在判断所述第一图像含有超过一个店头文字信息时，根据字词数据库进行相似度匹配，选出与目标店头信息所属行业最接近的一个店头，执行对所述第一图像进行文本区域检测。4.如权利要求1所述的一种基于OCR的店头文字识别方法，其特征在于，所述对所述第一图像进行文本区域检测，得到所述第一图像的文本区域数量及位置信息，具体地：通过基于深度学习技术对店头图像和文本区域标注数据进行训练得到的检测模型对所述第一图像进行文本区域检测，得到所述第一图像的文本区域数量及位置信息。5.如权利要求1所述的一种基于OCR的店头文字识别方法，其特征在于，所述对所述第二图像中的文本信息进行文字识别，得到输出文字信息，具体地：通过基于深度学习技术对文本图像和文本字符标注数据进行训练得到的识别模型对所述第二图像中的文本信息进行文字识别，得到输...

【专利技术属性】
技术研发人员：夏志鹏，丁明，李海荣，陈永辉，
申请(专利权)人：广州市玄武无线科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人