基于深度学习的高并发票据识别系统与方法技术方案

技术编号:16819619 阅读:40 留言:0更新日期:2017-12-16 13:13
本发明专利技术公开了一种基于深度学习的高并发票据识别系统与方法,统一API接口与票据分类系统相结合,使得该系统对任何票据的输入具有高兼容性;Nginx负载均衡服务器、HTTP SERVER集群、队列服务器与GPU票据识别集群的结合使得该票据识别系统具有高并发性;模板适配、序列定位系统与深度学习的字符识系统相结合使得该票据识别系统具有易操作性;票据分类系统、模板适配序列定位系统、深度学习的字符识别系统、票据字段匹配语义分析系统、票据小类提取语义分析系统和业务字段内容校正语义分析系统相结合使得该票据识别系统具有高的识别率。本发明专利技术相对于传统的票据识别系统,具有兼容性好、并发性高、操作性容易和识别率高等优点。

High parallel invoice identification system and method based on depth learning

The invention discloses a method based on the high and deep learning according to the invoice identification system and method, a unified API interface and bill classification system combined the input on any bill of this system has high compatibility; based on Nginx load balancing server, HTTP cluster, SERVER queue server and GPU cluster makes the bill bill recognition recognition system with high concurrency; template adaptation, sequence positioning system and deep learning the character recognition system combining the bill recognition system is easy to operate; bill classification system, template matching sequence positioning system, deep learning character recognition system, instrument field matching semantic analysis system, small class notes to extract semantic business analysis system and field content correction semantic analysis system combining the bill recognition system with high recognition rate. Compared with the traditional bill recognition system, the invention has the advantages of good compatibility, high concurrency, easy operation and high recognition rate.

【技术实现步骤摘要】
基于深度学习的高并发票据识别系统与方法
本专利技术涉及财务电子化
,具体涉及一种基于深度学习的高并发票据识别系统与方法。
技术介绍
近年来,随着我国经济的快速发展,票据的种类和数量呈逐年增多的趋势。财务系统对这些大量的票据进行手工处理,不仅会消耗大量的人力物力,而且工作效率低下。故实现票据的自动化处理,对单一的重复劳动有很大的实用价值,但是如果系统对票据中的有效内容识别率较低,不仅会带来业务风险,同时增加后续手工处理的工作量。因此,票据自动化识别系统需要具备高识别率抗干扰性以及实时性,才能保证其识别结果的可靠性;具有高并发性,才能针对多个客户端进行实时的访问及识别结果返回。传统的票据识别是通过一系列的预处理操作实现对目标信息的定位和识别,不断削弱外界干扰从而提高系统识别性能;票据种类繁多、版式多样,并且票据中的字符容易受印章等噪声的干扰,这就增加了票据字符识别的难度;对不同版面的票据进行自动化处理首先需要进行版面分析,实现对目标信息的准确定位与识别。北京文通科技有限公司、ABBYY、厦门云脉科技有限公司、上海合合技术有限公司、汉王、清华紫光等公司具有各自的票据识别系统,但是传统本文档来自技高网...
基于深度学习的高并发票据识别系统与方法

【技术保护点】
一种基于深度学习的高并发票据识别系统,其特征在于包括:负载均衡服务器,用于接收客户端上传的待识别的票据图片,并将票据图片分发到不同的网站服务器;网站服务器,用于将接收到的票据图片写入队列服务器;票据识别服务器,用于读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。

【技术特征摘要】
1.一种基于深度学习的高并发票据识别系统,其特征在于包括:负载均衡服务器,用于接收客户端上传的待识别的票据图片,并将票据图片分发到不同的网站服务器;网站服务器,用于将接收到的票据图片写入队列服务器;票据识别服务器,用于读取所述队列服务器中的票据图片并进行识别,以及将识别的结果写入所述队列服务器。2.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述负载均衡服务器上设置用于与客户端连接的统一数据接口。3.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器为GPU票据识别服务器。4.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器中包括:票据分类系统,用于通过定义好的模版特征对票据进行识别分类。5.根据权利要求1所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别服务器中包括票据识别框架和票据训练框架。6.根据权利要求5所述的基于深度学习的高并发票据识别系统,其特征在于所述票据识别框架包括:序列定位系统,用于将票据系统进行有效分割,将各个序列字符进行切分;或/和基于深度学习的字符识别系统,用于将序列字符进行拆分成各个字符,分别进入深度学习的字符识别系统进行字符识别;或/和票据字段匹配语义分析系统,用于将识别的结果进行拼凑,结合票据模板的位置信息,组合成key-value键...

【专利技术属性】
技术研发人员:牛小明刘东唐军池明辉田标肖欣庭孙永强蒲文龙李雁
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1