The invention provides an image based text entry method. The method includes obtaining an identification parameter corresponding to at least one area in the image, in which the identification parameter includes the text content identified from the at least one area and the position information associated with the at least one area; in response to the selection of the input position in the entry page, the following operation is performed: a plurality of standards are obtained. The parameter values shared by the page are checked, and the display page is automatically positioned to the area corresponding to the selected entry location based on the parameters shared by the multiple label pages obtained, in which the parameters shared by the multiple label pages include the position information corresponding to the selected entry position; and based on the selected data. The location information and recognition parameters corresponding to the location are input to determine the text content to be input.
【技术实现步骤摘要】
一种基于图像的文本录入方法
本专利技术涉及文本录入,尤其涉及一种基于图像的文本录入方法。
技术介绍
对票据、表格、文档等的录入,是当前实现对纸质信息数字化管理的重要环节,OCR识别技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术,作为针对纸质文件转化为可使用的计算机输入技术的主要方式之一,可应用于银行票据、档案卷宗、大量文字资料的录入和处理等领域,目前处理速度可达到每分钟60~80张票据,存折识别率已经达到了85%以上,存单、凭条识别率达到90%以上,85%以上的识别率就能减少80%以上的数据录入员,可减轻操作员的工作量,减少重复劳动。但由于并不能实现100%的精准识别,所以仍需要录入人员针对部分内容,对照文本进行手动操作录入,并且还需要针对已识别部分进行人工复核。因此,亟需一种基于图像的文本录入方法,使得录入人员可以实现快速录入。
技术实现思路
针对上述问题,本专利技术提出了一种基于图像的文本录入方法。本专利技术一方面提供了了一种基于图像的文本录入方法,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入 ...
【技术保护点】
一种基于图像的文本录入方法,其特征在于,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。
【技术特征摘要】
1.一种基于图像的文本录入方法,其特征在于,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。2.根据权利要求1所述的基于图像的文本录入方法,其特征在于,所述获取识别参数的步骤包括:对所述图像进行区域自动划分,并且对自动划分出的区域中的文本内容进行识别。3.根据权利要求2所述的基于图像的文本录入方法,其特征在于,对所述自动划分出的区域中的文本内容进行识别的步骤包括:采用OCR方式对所述自动划分出的区域中的文本内容进行识别。4.根据权利要求2所述的基于图像的文本录入方法,其特征在于,对所述自动划分出的区域中的文本内容进行识别的步骤包括:对识别出的文本内容进行打分,以进行识别准确度标识。5.根据权利要求1中所述的基于图像的文本录入方法,其特征在于,显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域的步骤包括:对所述与所选中的录入位置相对应的区域进行缩放。6.一种基于图像的文本录入装置,其特征在于,包括:获取识别参数单元,被配置为获取对应...
【专利技术属性】
技术研发人员:徐海燕,冯博,袁皓,孙谷飞,
申请(专利权)人:众安信息技术服务有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。