识别数码管文本的方法、装置及电子设备制造方法及图纸

技术编号:28624948 阅读:37 留言:0更新日期:2021-05-28 16:21
本申请涉及识别数码管文本的方法、装置及电子设备,属于字符识别技术领域,本申请识别数码管文本的方法包括,获取目标设备的现场采集图像;从预先构建的模型图库中选取与该目标设备相匹配的设备模型图,根据设备模型图对现场采集图像进行识别扣取,得到待识别区域图像;基于待识别区域图像,采用预先构建并训练好的数码管文本识别模型进行文本识别,得到文本识别结果;根据与设备模型图相关联的文本属性配置信息和所述文本识别结果进行匹配组合处理,将组合得到结构化数据作为最终识别结果。本申请更好的实现了对数码管显示的识别。

【技术实现步骤摘要】
识别数码管文本的方法、装置及电子设备
本申请属于字符识别
,具体涉及一种识别数码管文本的方法、装置及电子设备。
技术介绍
光学字符识别OCR一般是指使用电子设备(扫描仪、数码相机等)检查纸上打印的文字,通过检测明暗和形状,使用字符识别技术,将其翻译成文字的过程。传统OCR识别应用广泛使用Tesseract-OCR,该软件是惠普公司布里斯托尔实验室在1984-1994年开发完成的,最初作为惠普的平板扫描仪的文字识别引擎。1995年UNLVOCR字符识别准确性测试中获得第一而受到广泛关注。1994年后因惠普放弃OCR市场停止开发。2005年惠普将Tesseract-OCR贡献给开源社区。Google获得该源码开始对其进行功能扩展及优化。在复杂场景下,进行OCR识别(如商品照片品牌识别、网页信息识别、自动驾驶路牌识别、标准证件识别、车牌识别等),其核心算法主要由文本检测、字符分割和字符识别三部分组成(部分神经网络不需要字符分割)。文件检测方法分为图形图像学定位和机器学习定位,图形学定位分颜色定位、纹理定位、边缘检测、数学形态,但本文档来自技高网...

【技术保护点】
1.一种识别数码管文本的方法,其特征在于,包括:/n获取目标设备的现场采集图像;/n从预先构建的模型图库中选取与该目标设备相匹配的设备模型图,根据所述设备模型图对所述现场采集图像进行识别扣取,得到待识别区域图像;/n基于所述待识别区域图像,采用预先构建并训练好的数码管文本识别模型进行文本识别,得到文本识别结果;/n根据与所述设备模型图相关联的文本属性配置信息和所述文本识别结果进行匹配组合处理,将组合得到结构化数据作为最终识别结果。/n

【技术特征摘要】
1.一种识别数码管文本的方法,其特征在于,包括:
获取目标设备的现场采集图像;
从预先构建的模型图库中选取与该目标设备相匹配的设备模型图,根据所述设备模型图对所述现场采集图像进行识别扣取,得到待识别区域图像;
基于所述待识别区域图像,采用预先构建并训练好的数码管文本识别模型进行文本识别,得到文本识别结果;
根据与所述设备模型图相关联的文本属性配置信息和所述文本识别结果进行匹配组合处理,将组合得到结构化数据作为最终识别结果。


2.根据权利要求1所述的方法,其特征在于,所述从预先构建的模型图库中选取与该目标设备相匹配的设备模型图,具体为:
根据所述现场采集图像所含有的目标设备的型号信息,从预先构建的模型图库中选取与该目标设备相匹配的设备模型图。


3.根据权利要求1所述的方法,其特征在于,所述根据所述设备模型图对所述现场采集图像进行识别扣取,得到待识别区域图像,具体为:
采用模型图匹配算法,从所述设备模型图提取特征点,根据所述特征点对所述现场采集图像进行识别扣取,并将识别扣取的区域图像进行尺寸和角度矫正,来得到所述待识别区域图像。


4.根据权利要求3所述的方法,其特征在于,所述特征点包括角点、边缘点、暗区域的亮点。


5.根据权利要求1所述的方法,其特征在于,所述基于所述待识别区域图像,采用预先构建并训练好的数码管文本识别模型进行文本识别,得到文本识别结果,包括:
根据与所述设备模型图相关联的文本位置配置信息从所述待识别区域图像中确定并提取文本单元图像;
对所述文本单元图像进行预处理,根据处理后的图像采用所述数码管文本识别模块进行文本识别,以得到所述文本识别结果。
<...

【专利技术属性】
技术研发人员:王宗会杨林尹恒郭峰
申请(专利权)人:珠海世纪鼎利科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1