一种基于金融领域应用场景的字符识别方法技术

技术编号:24686135 阅读:63 留言:0更新日期:2020-06-27 08:42
本发明专利技术涉及字符识别,具体涉及一种基于金融领域应用场景的字符识别方法,对单据进行扫描,对扫描后的图像进行前景提取,将单据从图像背景中分离出来,从单据中提取识别检测区域图片,利用训练后的手写体识别模型,对手写体检测区域图片进行识别,利用训练后的打印体识别模型,对打印体检测区域图片进行识别,汇总识别结果并输出;本发明专利技术提供的技术方案能够有效克服现有技术所存在的无法自动提取单据内的固定文本区域、不能对单据内不同字体的字符进行有效识别的缺陷。

A method of character recognition based on financial application scenario

【技术实现步骤摘要】
一种基于金融领域应用场景的字符识别方法
本专利技术涉及字符识别,具体涉及一种基于金融领域应用场景的字符识别方法。
技术介绍
目前,我国正处于金融自动化、智能化阶段,金融被认为是人工智能落地最快的领域之一,智能金融也被列入国家发展规划,依托人工智能技术能够为客户提供更加便捷的交互服务。人工智能在金融领域的应用将彻底改变当前人类的生产模式,取代更多人、更多重复性的工作,劳动密集型的工作将完全由机器人完成,人力将投入到更具价值的事情。在金融领域,传统业务办理、报销流程办理过程繁琐,涉及到一系列票据填写、手写签字确认等人工办理流程,使得对公业务服务效率极低、客户体验感较差,对银行的业务拓展极为不利。另外,传统票据报销需要人工确认、核对手写报销金额,使得企业办公效率低下。OCR识别为上述问题的有效解决带来了曙光,研究OCR识别技术,大量票据填写、手写签字确认等需要人工进行的工作,均可交由智能设备通过OCR识别技术完成,将极大简化办理流程、节省人力和时间成本,提高企业竞争力。涉及金融单据字符识别,主要具有以下难点:>一、用于建模的实际本文档来自技高网...

【技术保护点】
1.一种基于金融领域应用场景的字符识别方法,其特征在于:包括以下步骤:/nS1、对单据进行扫描,对扫描后的图像进行前景提取,将单据从图像背景中分离出来;/nS2、从单据中提取识别检测区域图片;/nS3、利用训练后的手写体识别模型,对手写体检测区域图片进行识别;/nS4、利用训练后的打印体识别模型,对打印体检测区域图片进行识别;/nS5、汇总识别结果并输出。/n

【技术特征摘要】
1.一种基于金融领域应用场景的字符识别方法,其特征在于:包括以下步骤:
S1、对单据进行扫描,对扫描后的图像进行前景提取,将单据从图像背景中分离出来;
S2、从单据中提取识别检测区域图片;
S3、利用训练后的手写体识别模型,对手写体检测区域图片进行识别;
S4、利用训练后的打印体识别模型,对打印体检测区域图片进行识别;
S5、汇总识别结果并输出。


2.根据权利要求1所述的基于金融领域应用场景的字符识别方法,其特征在于:所述对扫描后的图像进行前景提取,将单据从图像背景中分离出来,包括以下步骤:
S1、进行前景增强,通过中值滤波、二值化、灰度化增大单据与图像背景的色差;
S2、进行单据分割,通过统计扫描图像在水平方向、竖直方向上的像素和判定单据在扫描图像上的边界,并将单据与图像背景分离。


3.根据权利要求2所述的基于金融领域应用场景的字符识别方法,其特征在于:所述中值滤波的方框尺寸为257。


4.根据权利要求2所述的基于金融领域应用场景的字符识别方法,其特征在于:若所述水平方向上的像素和超过设定阈值,则判断该行为单据所在区域;若所述竖直方向上的像素和超过设定阈值,则判断该列为单据所在区域。


5.根据权利要求1所述的基于金融领域应用场景的字符识别方法,其特征在于:所述从单据中提取识别检测区域图片,包括以下步骤:
S1、利用相对坐标法对单据中的检测区域图片进行分割提取;
S2、判断分割提取得到的检测区域图片属于手写体检测区域图片还是打印体检测区域图片,并进行分类。


6.根据权利要求5所述的基于金融领域应用场景的字符识别方法,其特征在于:所述手写体检测区域图片的识别方法包括单字识别和多字识别,所述单字识别包括以下步骤:
S1、分别采用直方图法、K-means聚类法...

【专利技术属性】
技术研发人员:赵富强余炅桦徐雪
申请(专利权)人:天津得迈科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1