【技术实现步骤摘要】
票据识别方法、系统、计算机设备与计算机可读存储介质
本专利技术实施例涉及发票识别领域,尤其涉及一种票据识别方法、系统、计算机设备与计算机可读存储介质。
技术介绍
伴随着企业经营管理规模的扩大与业务的拓展,财务部门需要审核整理票据的工作量也是与日俱增,每月都要面对大量的纸质票据,并将这些纸质票据中的内容转化为可存储的结构化信息。以及在医疗行业中,有大量的处方签需要进行识别转化成可存储的文字信息。目前而言,多数中小企业对于票据的处理主要依赖于人工手动进行票据信息的录入,处方签也需要通过人工录入,该方式不仅效率低、周期长,而且在高强度重复工作压力下难免精神懈怠导致工作错误。对于技术高度发达的今天,显然这种模式已经不能满足人们对效率和智能化的追求。针对上述问题,可以通过光学字符识别(OCR)技术,借助光学设备,使用票据识别技术,实现票信息结构化自动录入。现有产品中,百度开发的iOCR自定义模板文字识别系统能够实现只需上传一张模板图片,即可自助制作识别模型,建立图片中文字的key-value对应关系,实现对相同版式图片 ...
【技术保护点】
1.一种票据识别方法,其特征在于,包括:/n获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域;/n将所述模板票据图片输入至文字识别模型,以识别出所述第一参考字段区域中的文本,并通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息;/n接收待处理票据图片,并将所述待处理票据图片输入至所述文字识别模型,识别出与所述文本匹配的目标文本,并通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息;/n根据所述第一位置信息与所述第一目标位置信息建立变换矩阵;/n通过所述变换矩阵计算所述第二位置信息,得到所述 ...
【技术特征摘要】
1.一种票据识别方法,其特征在于,包括:
获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域;
将所述模板票据图片输入至文字识别模型,以识别出所述第一参考字段区域中的文本,并通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息;
接收待处理票据图片,并将所述待处理票据图片输入至所述文字识别模型,识别出与所述文本匹配的目标文本,并通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息;
根据所述第一位置信息与所述第一目标位置信息建立变换矩阵;
通过所述变换矩阵计算所述第二位置信息,得到所述待处理票据图片中第二识别区域的第二目标位置信息;
根据所述第一位置信息与所述第二位置信息的重叠度值,调整所述第二目标位置信息,得到待识别区域,并通过所述文字识别模型识别所述待识别区域中的文本,得到识别结果。
2.根据权利要求1所述的票据识别方法,其特征在于,所述获取模板票据图片,所述模板票据图片包括框选的第一参考字段区域以及第二参考字段区域包括:
选取标准图片格式的票据图片作为模板票据图片;
框选出文字条的字段内容作为第一参考字段区域以及所述文字条对应的数据内容作为第二参考字段区域。
3.根据权利要求1所述的票据识别方法,其特征在于,所述通过检测模型输出所述第一参考字段区域的第一位置信息与所述第二参考字段区域的第二位置信息包括:
通过所述检测模型对所述第一参考字段区域与所述第二参考字段区域进行边框识别,得到第一参考字段区域的第一边框顶点与所述第二参考字段区域对应的第二边框顶点;
将所述模板票据图片的任意顶点作为坐标原点建立坐标系,得到所述第一边框顶点的第一边框坐标与所述第二边框顶点的第二边框坐标,其中,所述第一位置信息包括多个第一边框坐标,所述第二位置信息包括多个第二边框坐标。
4.根据权利要求1所述的票据识别方法,其特征在于,所述通过所述检测模型框选标记所述目标文本的第一识别区域与第一目标位置信息包括:
通过所述检测模型对所述第一识别区域进行框选,得到多个第三边框顶点;
以所述待处理票据图片的任意顶点作为坐标原点建立坐标系,得到所述第三边框顶点的第三边框坐标,其中,所述第一目标位置信息包括多个第三边框坐标。
5.根据权利要求4所述的票据识别方法,其特征在于,所述根据所述第一位置信息与所述第...
【专利技术属性】
技术研发人员:王文浩,徐国强,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。