The invention belongs to the field of image detection and recognition, and relates to a method for character recognition and information input in any area of a form. The invention adopts image acquisition camera lens alignment form, illumination light source to illuminate the form, forms are placed on the drive belt or the placement table, and the camera is connected to the computer to collect the template form image, and off-line constructs the template feature parameter library of the form area in the region of interest, forms image online acquisition and image screening to be recognized, forms area extraction and pose standardization. Single Interest Region Extraction and Character Entry Operations. Compared with the traditional information recognition and input method, the invention has more flexibility in function, more economy in benefit and good performance in practical scene application.
【技术实现步骤摘要】
一种表单任意区域字符识别与信息录入方法
本专利技术属于图像检测与识别领域,主要涉及一种表单中任意区域字符识别与信息录入方法。
技术介绍
当今世界已进入信息爆炸时代,各类信息都以电子化的形式存储在个人电脑或服务器中。但这些电子化信息的录入如果仅仅靠人手工输入,很难满足对工作效率的要求。例如:现如今中国的物流行业发展迅速,每天有数以亿计的货物、物流信息需要录入更新,而这些信息大部分通常都以一张货物表单的形式呈现,货物表单上的信息也纷繁复杂,靠人工录入关键数据的方式显然不太现实。现有的传统信息录入系统,一般采用专门的扫描设备,将表单转化为图像,再利用搜索特定的图像特征或者位置信息进行字符区域的提取,然后再利用OCR技术对字符进行识别。这些方法有几个明显缺点,(1)扫描对象需要人工手动对准,例如:扫描枪需要靠近并对准需要检测的条形码或二维码;(2)每家公司设计的表单大小不同,同一家公司对不同货物的表单设计也有可能不同,传统单一信息扫描与录入系统无法做到通用识别;(3)现有扫描系统对扫描对象的摆放姿态也具有一定要求,不能识别任意摆放的表单信息。上述这些缺点都大大限制了现有表单信息录入系统的灵活度。
技术实现思路
为解决上述问题,本专利技术提供了一种表单任意区域的字符识别与信息录入方法。所用采集系统主要包括:图像采集相机、计算处理系统、照明光源、传动装置等。图像采集相机放置于传动装置上方,用于采集包含表单的图像。计算处理系统用于接收图像采集相机采集到的图像,并进行图像处理、字符识别等。照明光源负责抑制环境光对图像采集效果的影响。传动装置负责传送或者放置含待识别表单的装置。 ...
【技术保护点】
1.一种表单任意区域字符识别与信息录入方法,其特征在于,采用图像采集相机镜头对准表单,照明光源对表单照明,表单置于传动带或置物台上,采集相机连接电脑,从而进行操作步骤如下:1)采集模板表单图像;2)离线构建表单区域与兴趣区域的模板特征参数库,并行支撑后续步骤;3)表单图像在线采集与待识别图像筛选,不满足筛选条件即返回;4)表单区域提取与位姿标准化,不满足筛选条件即返回;5)表单中兴趣区域提取与字符识别录入,完成并返回。
【技术特征摘要】
1.一种表单任意区域字符识别与信息录入方法,其特征在于,采用图像采集相机镜头对准表单,照明光源对表单照明,表单置于传动带或置物台上,采集相机连接电脑,从而进行操作步骤如下:1)采集模板表单图像;2)离线构建表单区域与兴趣区域的模板特征参数库,并行支撑后续步骤;3)表单图像在线采集与待识别图像筛选,不满足筛选条件即返回;4)表单区域提取与位姿标准化,不满足筛选条件即返回;5)表单中兴趣区域提取与字符识别录入,完成并返回。2.根据权利要求1所述的一种表单任意区域字符识别与信息录入方法,其特征在于:所述步骤1)采集模板表单图像获取的模板表单图像,主要用于离线构建表单区域与兴趣区域的模板特征参数库,并以各类特征参数的形式支撑后续的步骤与方法,针对不同类型模板进行相对应的特征参数库,扩展系统对不同表单的识别,可实现对任意表单中任意区域信息的识别。3.根据权利要求1所述的一种表单任意区域字符识别与信息录入方法,其特征在于:所述步骤2)中表单区域与兴趣区域(信息区域)模板特征参数库构建的方法为:根据采集的模板表单图像,通过人机交互的方式,利用鼠标点击框选的方法分别获得表单区域和信息区域,然后计算其对应的模板特征参数,并构建参数库,参数库主要包括:表单区域和信息区域分别对应的最大内切椭圆长轴长度、短轴长度、中心点坐标,区域面积、连通域个数,以及表单区域与信息区域相对位置关系。4.根据权利要求1所述的一种表单任意区域字符识别与信息录入方法,其特征在于:所述步骤3)中表单图像在线采集与表单区域筛选的方法:综合考虑当前帧与上一帧图像的相似度、表单区域的连通...
【专利技术属性】
技术研发人员:杨傲雷,刘佳奇,陈灵,徐昱琳,杨帮华,
申请(专利权)人:上海大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。