本发明专利技术提出了一种票据识别方法、票据识别装置和计算机可读存储介质,其中,票据识别方法包括:获取待识别图片;确定待识别图片中的至少一个票据区域;识别票据区域中的文字信息;根据文字信息确定每个票据区域内的票据元素;根据票据元素,对应存储每个票据元素的元素值。根据本发明专利技术的技术方案,在进行票据识别时,先对票据元素进行确定,再确定对应数据,将对应的元素值进行存储,可有效提高识别的准确率。率。率。
【技术实现步骤摘要】
票据识别方法、票据识别装置和计算机可读存储介质
[0001]本专利技术涉及票据识别
,具体而言,涉及一种票据识别方法、一种票据识别装置和一种计算机可读存储介质。
技术介绍
[0002]现有的票据识别,在自动识别的过程中,通常对单张图片的票据数量存在一定的限制,且在进行识别时,最终的识别结果准确率不高。
技术实现思路
[0003]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0004]有鉴于此,本专利技术实施例的第一方面提供了一种票据识别方法。
[0005]本专利技术实施例的第二方面提供了一种票据识别装置。
[0006]本专利技术实施例的第三方面提供了一种计算机可读存储介质。
[0007]为了实现上述目的,本专利技术第一方面的实施例提供了一种票据识别方法。包括:获取待识别图片;确定待识别图片中的至少一个票据区域;识别票据区域中的文字信息;根据文字信息确定每个票据区域内的票据元素;根据票据元素,对应存储每个票据元素的元素值。
[0008]根据本专利技术提出的票据识别方法,可对图片中票据的各项信息进行提取,极大的提高识别的准确率。具体地,在进行识别时,先将待识别图片进行获取,以确定所需要进行识别的对象,在此基础上,通过对待识别图片进行票据识别,从而可确定出待识别图片中存在有一个或多个票据区域,进而便于确定出每个票据区域内所包含的具体的票据元素,从而利于在后续对数据进行汇总统计时,一方面便于对同类数值进行合算,另一方面也便于对对应的具体数值进行分类存储,进而利于后续的数据统计。
[0009]可以理解,在一张图片中可能存在多张票据需要被识别,一般来说,为了保证每张票据的清晰程度,通常会将多张票据错开排布。在此基础上,可将待识别图片分为一个或多个票据区域,每个票据区域对应于一张票据,通过对票据区域进行文字识别,也即识别每个票据区域中的文字信息,即可获取到该票据区域内的具体内容。在此基础上,由于识别时先对票据元素进行确定,再确定对应数据,将对应的元素值进行存储,可有效提高识别的准确率。
[0010]此外,本实施例中,由于在进行文字识别时,主要是依次对票据元素和元素值进行识别和存储,从而可利于后续对数据的结构化分析和归类,极大的满足用户的统计需求。
[0011]其中,待识别图片的获取方式包括但不局限于本地上传、外接存储设备的传输或是任意数据传输方式。
[0012]另外,本专利技术提供的上述方案中的票据识别方法还可以具有如下附加技术特征:
[0013]上述技术方案中,确定待识别图片中的至少一个票据区域,具体包括:判断待识别图片中是否存在票据标识,生成判断结果;若判断结果为是,则确定每个票据标识的位置信
息;根据位置信息确定至少一个票据区域。
[0014]在该技术方案中,在确定票据区域时,主要是通过票据标识进行识别的。具体地,先对待识别图片中是否存在有票据标识进行判断,如果存在,则说明该区域属于票据区域,但此时仍需对票据区域的位置进行判断,故而需要确定每个票据标识的位置信息。
[0015]一般来说,对于固定类别的票据而言,其票据标识的位置以及票据的自身大小较为固定,不会发生过大的变化,如果因拍照焦距的变化而使得尺寸发生变化,那么也可以通过票据标识和整体尺寸的比例关系进行换算得到,故而可直接通过确定票据标识的位置,判断出整个票据区域的范围,也即根据位置信息确定出对应的票据区域。
[0016]上述技术方案中,还包括:确定每个票据区域对应的票据类型;根据票据类型确定对应的票据元素。
[0017]在该技术方案中,对于不同类型的票据而言,票据类型的不同,很可能导致其内部包含的信息有所差异,故而需要对每个票据区域进行票据类型的确定,在此基础上再确定对应的票据元素,进一步提升整体票据识别的准确率。
[0018]需要说明的,在确定票据类型时,可以通过独特的票据标识进行区分,还可以通过该票据类型所独有的票据元素进行区分,当然也可以采用任意区分方式实现区分。
[0019]上述技术方案中,识别票据区域中的文字信息,具体包括:根据预设文字检测模型检测待识别图片中的包含文字信息的文字区域;确定与每个票据区域中对应的至少一个文字区域。
[0020]在该技术方案中,在对票据区域中的文字信息进行识别时,主要是现通过预设文字检测模型对文字区域进行检测的。具体地,通过预设文字检测模型会确定出待识别图片中具体包含有文字信息的文字区域,再将文字区域和票据区域进行关联对应,确定出每个票据区域的文字区域,以便于再进行文字识别时,与不同的票据区域进行对应,显著提高识别的准确度。
[0021]其中,预设文字检测模型可以为Differentiable Binarization(DB)模型。利用Differentiable Binarization(DB)模型对图片中的文字进行检测,判断哪些区域存在文字,返回所有包含文字的区域的位置。
[0022]上述技术方案中,还包括:根据预设文字识别模型确定每个文字区域中的文字信息。
[0023]在该技术方案中,在完成对文字区域的识别后,还需要根据预设文字识别模型对每个文字区域所表示的文字信息进行具体识别,由于识别的对象是已经区分好不同的文字区域的,只需要针对每个文字区域实现针对性的文字识别。可有效提高识别的准确率。
[0024]其中,预设文字识别模型可以为CRNN模型,将包含文字的区域从图片中提取出来,依次输入CRNN模型,识别这些区域中具体的文字及其对应的位置。
[0025]上述技术方案中,还包括:根据预设印章检测模型检测待识别图片中的所有印章信息;确定印章信息的印章数量以及印章类别;根据预设文字识别模型确定每个印章信息对应的印章文字信息。
[0026]在该技术方案中,在进行票据分析时,还需要对待识别图片内的印章信息进行检测,一方面可以对票据的真伪进行初步判断,另一方面由于增加了印章识别,可提高票据识别的准确性。具体地,在进行判断时,首先对待识别图片中的所有印章信息进行检测,再确
定印章数量和印章类别,以便于对不同票据区域内所对应的印章数量和印章类别进行核对,提高识别的准确性。在此基础上,通过利用预设文字识别模型对印章文字信息进行确定,可确定出印章文本的具体意义,更便于对印章类别进行二次确认。
[0027]其中,预设印章检测模型可以为mask
‑
rcnn模型,从而利用mask
‑
rcnn模型对票据图像中是否有印章进行检测。
[0028]上述技术方案中,根据文字信息确定每个票据区域内的票据元素,具体包括:确定每个票据区域内的元素标题;获取元素值偏移参数;根据元素值偏移参数确定与每个元素标题对应的元素值。
[0029]在该技术方案中,在确定票据元素时,主要是内通过过此前识别出的文字进行确定的,在对票据元素进行确定时,首先需要确定出位于票据区域内的不同的元素标题。可以理解,元素标题即为在票据上位置相对固定的标题位置,定本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种票据识别方法,其特征在于,包括:获取待识别图片;确定所述待识别图片中的至少一个票据区域;识别所述票据区域中的文字信息;根据所述文字信息确定每个所述票据区域内的票据元素;根据所述票据元素,对应存储每个所述票据元素的元素值。2.根据权利要求1所述的票据识别方法,其特征在于,所述确定所述待识别图片中的至少一个票据区域,具体包括:判断所述待识别图片中是否存在票据标识,生成判断结果;若所述判断结果为是,则确定每个所述票据标识的位置信息;根据所述位置信息确定至少一个票据区域。3.根据权利要求2所述的票据识别方法,其特征在于,还包括:确定每个所述票据区域对应的票据类型;根据所述票据类型确定对应的票据元素。4.根据权利要求1所述的票据识别方法,其特征在于,所述识别所述票据区域中的文字信息,具体包括:根据预设文字检测模型检测所述待识别图片中的包含文字信息的文字区域;确定与每个所述票据区域中对应的至少一个文字区域。5.根据权利要求4所述的票据识别方法,其特征在于,还包括:根据预设文字识别模型确定每个所述文字区域中的文字信息。6.根据权利要求5所述的票据识别方法,其特征在于,还包括:根据预设印章...
【专利技术属性】
技术研发人员:张宇,裴芝林,金基勇,
申请(专利权)人:用友网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。