一种基于图像的文本录入方法技术

技术编号:17796942 阅读:32 留言:0更新日期:2018-04-25 20:27
本发明专利技术提供了一种基于图像的文本录入方法。该方法包括:获取对应于图像中的至少一个区域的识别参数,其中,识别参数包括从该至少一个区域中识别出的文本内容和与该至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于与所选中的录入位置相对应的位置信息和识别参数,确定将被录入的文本内容。

A method of text entry based on image

The invention provides an image based text entry method. The method includes obtaining an identification parameter corresponding to at least one area in the image, in which the identification parameter includes the text content identified from the at least one area and the position information associated with the at least one area; in response to the selection of the input position in the entry page, the following operation is performed: a plurality of standards are obtained. The parameter values shared by the page are checked, and the display page is automatically positioned to the area corresponding to the selected entry location based on the parameters shared by the multiple label pages obtained, in which the parameters shared by the multiple label pages include the position information corresponding to the selected entry position; and based on the selected data. The location information and recognition parameters corresponding to the location are input to determine the text content to be input.

【技术实现步骤摘要】
一种基于图像的文本录入方法
本专利技术涉及文本录入,尤其涉及一种基于图像的文本录入方法。
技术介绍
对票据、表格、文档等的录入,是当前实现对纸质信息数字化管理的重要环节,OCR识别技术是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术,作为针对纸质文件转化为可使用的计算机输入技术的主要方式之一,可应用于银行票据、档案卷宗、大量文字资料的录入和处理等领域,目前处理速度可达到每分钟60~80张票据,存折识别率已经达到了85%以上,存单、凭条识别率达到90%以上,85%以上的识别率就能减少80%以上的数据录入员,可减轻操作员的工作量,减少重复劳动。但由于并不能实现100%的精准识别,所以仍需要录入人员针对部分内容,对照文本进行手动操作录入,并且还需要针对已识别部分进行人工复核。因此,亟需一种基于图像的文本录入方法,使得录入人员可以实现快速录入。
技术实现思路
针对上述问题,本专利技术提出了一种基于图像的文本录入方法。本专利技术一方面提供了了一种基于图像的文本录入方法,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。在一种实施方式中,所述获取识别参数的步骤包括:所述获取识别参数的步骤包括:对所述图像进行区域自动划分,并且对自动划分出的区域中的文本内容进行识别。在一种实施方式中,对所述自动划分出的区域中的文本内容进行识别的步骤包括:采用OCR方式对所述自动划分出的区域中的文本内容进行识别。在一种实施方式中,对所述自动划分出的区域中的文本内容进行识别的步骤包括:对识别出的文本内容进行打分,以进行识别准确度标识。在一种实施方式中,显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域的步骤包括:对所述与所选中的录入位置相对应的区域进行缩放。本专利技术另一方面提供了一种基于图像的文本录入装置,包括:获取识别参数单元,被配置为获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;录入与显示联动单元,被配置为响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及录入文本确定单元,被配置为基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。在一种实施方式中,所述获取识别参数单元还包括图像划分和识别单元,其被配置为对所述图像进行区域自动划分,并且对自动划分出的区域中的文本内容进行识别。在一种实施方式中,所述图像划分和识别单元还被配置为采用OCR方式对所述自动划分出的区域中的文本内容进行识别。在一种实施方式中,所述图像划分和识别单元还被配置为对识别出的文本内容进行打分,以进行识别准确度标识。在一种实施方式中,所述录入与显示联动单元还包括图像缩放单元,所述图像缩放单元被配置为对所述与所选中的录入位置相对应的区域进行缩放。本专利技术另一方面提供了一种计算机可读存储介质,其上存储有处理器可执行指令,所述处理器执行所述可执行指令时,执行上述基于图像的文本录入方法中任一项所述的方法。本专利技术的有益技术效果:本专利技术提供的基于图像的文本录入方法使得可以高效地进行表格、票据、文档等的快速录入的交互操作,并且由于当录入人员在选中的输入框中进行录入时,上传的图像将被自动切换到相对应的位置并且图像的内容被放大,使得录入人员不需要依靠纯手动方式拖动图像来实现录入,大大节约了对照图像进行录入的时间,提高录入效率;同时针对通过OCR方式识别出的文本内容进行识别准确度标识,使得用户在进行复核时,可以直接根据识别准确度的情况进行快速查看,可有效的缩短复核时间,极大提高了录入效率。附图说明图1是根据本专利技术的实施例的基于图像的文本录入方法的流程图;图2是根据本专利技术的实施例的实现票据文本录入的方法流程图;图3是根据本专利技术的实施例的在显示页面中显示的票据图像的一个示例;图4是根据本专利技术的实施例的录入页面的一个示意图;图5是根据本专利技术的实施例的基于图像的文本录入装置的示意图。具体实施方式在以下优选的实施例的具体描述中,将参考构成本专利技术一部分的所附的附图。所附的附图通过示例的方式示出了能够实现本专利技术的特定的实施例。示例性实施例并不旨在穷尽根据本专利技术的所有实施例。可以理解,在不偏离本专利技术的范围的前提下,可以利用其他实施例,也可以进行结构性或者逻辑性的修改。因此,以下的具体描述并非限制性的,且本专利技术的范围由所附的权利要求所限定。以下结合附图对本专利技术进行详细描述。图1根据本专利技术实施例的基于图像的文本录入方法的流程图。本专利技术提供了基于图像的文本录入方法,该方法包括如下步骤:步骤S101:获取对应于图像中的至少一个区域的识别参数,其中,识别参数包括从至少一个区域中识别出的文本内容和与至少一个区域相关联的位置信息;步骤S102:响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;步骤S103:基于与所选中的录入位置相对应的位置信息和识别参数,确定将被录入的文本内容。应理解的是,本方法所针对的图像包括票据、表格、文档等多种纸质文件,不局限于某一种特定的纸质文件。下面以票据为例,进一步详细阐述本专利技术所提供基于图像的文本录入方法。图2是根据本专利技术的实施例的实现票据文本录入的方法流程图。下面结合图2、3、4对票据文本录入的实现过程进行详细描述。步骤S201:将票据图像上传到录入系统。在该步骤中,用户将需要用到所需的票据文件通过扫描仪等任意适当的方式上传到系统,如果上传有误,则系统将根据出错类型提示用户重新上传图像。步骤S202:判断系统中是否存在图像自动划分模型,如果存在,则进行步骤S203,否则进行步骤S204。步骤S203:通过图像自动划分模型对票据图像进行自动划分,获得自动划分出的区域的位置信息。本实施例中的图像自动划分模型为基于机器学习算法的模型,通过判断图像中的关键字位置来对图像进行区域自动划分。应理解,还可以基于任意适当的模型以及通过任何适当的方式对图像进行区域自动划分。步骤S204:进入纯手动录入模式。步骤S205:通过OCR方式对自动划分出的区域中的文本内容进行自动识别。应当理解,也可以采用任意适当的其它方式对自动划分后的区域中的文本内容进行自动识别。步骤S206本文档来自技高网...
一种基于图像的文本录入方法

【技术保护点】
一种基于图像的文本录入方法,其特征在于,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。

【技术特征摘要】
1.一种基于图像的文本录入方法,其特征在于,包括:获取对应于所述图像中的至少一个区域的识别参数,其中,所述识别参数包括从所述至少一个区域中识别出的文本内容和与所述至少一个区域相关联的位置信息;响应于在录入页面中选中录入位置而执行以下操作:获取多个标签页面共享的参数值,并且显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域,其中,所述多个标签页面共享的参数值包括与所选中的录入位置相对应的位置信息;以及基于所述与所选中的录入位置相对应的位置信息和所述识别参数,确定将被录入的文本内容。2.根据权利要求1所述的基于图像的文本录入方法,其特征在于,所述获取识别参数的步骤包括:对所述图像进行区域自动划分,并且对自动划分出的区域中的文本内容进行识别。3.根据权利要求2所述的基于图像的文本录入方法,其特征在于,对所述自动划分出的区域中的文本内容进行识别的步骤包括:采用OCR方式对所述自动划分出的区域中的文本内容进行识别。4.根据权利要求2所述的基于图像的文本录入方法,其特征在于,对所述自动划分出的区域中的文本内容进行识别的步骤包括:对识别出的文本内容进行打分,以进行识别准确度标识。5.根据权利要求1中所述的基于图像的文本录入方法,其特征在于,显示页面根据所获取的多个标签页面共享的参数值自动定位到与所选中的录入位置相对应的区域的步骤包括:对所述与所选中的录入位置相对应的区域进行缩放。6.一种基于图像的文本录入装置,其特征在于,包括:获取识别参数单元,被配置为获取对应...

【专利技术属性】
技术研发人员:徐海燕冯博袁皓孙谷飞
申请(专利权)人:众安信息技术服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1