一种在票据中识别大写金额的方法技术

技术编号:21062227 阅读:39 留言:0更新日期:2019-05-08 08:06
本发明专利技术公开在票据中识别大写金额的方法,包括采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;对多种图像投影初次分割,选择通过求连通区域的方法将字符分开:或利用区域梯度图像,与卷积核卷积运算,利用像素点梯度,通过形成的分割路径将该子区域内的字符分开,最终形成字符分割算法;识别时,利用该字符分割算法对票据中的数字大写图像分割,形成单个字符然后输入到神经网识别模型中进行字符识别。本发明专利技术实现了对手写体大写金额的快速分割。

【技术实现步骤摘要】
一种在票据中识别大写金额的方法
本专利技术涉及图像识别
,特别是涉及一种在票据中识别大写金额的方法。
技术介绍
在票据鉴伪和识别中,针对票据图像,需要识别其中手写体的大写金额,如"零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾"等。识别过程一般分为三步:1.在图像中裁剪出包含手写体金额的大致范围。2.将手写体金额分割为单个的字符。3.用神经网络识别每个字符。第一步较为简单,因为手写体金额在票据中的相对位置是固定的。第二步的难点在于,由于不同人的手写风格十分迥异,且存在连笔的情形,因此字符分割很难做到百分百精确。比如在连笔字的情形前一个汉字的某些笔画可能与后一个汉字合并在一起,或者两个十分接近的汉字被合并为一个汉字。在票据识别这种对识别率要求非常高的场景,寻找更准确的汉字字符分割算法是非常必要的。第三步的难点在于获取包含足够样本量的训练数据。目前开源的汉字手写体数据集(如模式识别国家重点实验室发表的HWDB数据集)都是针对大多数常用汉字的,其中大写数字的样本量较小。
技术实现思路
本专利技术的目的是针对现有技术中存在的技术缺陷,而提供一种在票据中识别大写金额的方法。为实现本专利技术的目的本文档来自技高网...

【技术保护点】
1.一种在票据中识别大写金额的方法,其特征在于,包括步骤:采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;对多种所述图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将该梯度方向看作是该像素点的笔画方向;从该子区域顶部的一个梯度为零的初始像素点开始,选择向下方梯度最小的像素点而向...

【技术特征摘要】
1.一种在票据中识别大写金额的方法,其特征在于,包括步骤:采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;对多种所述图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将...

【专利技术属性】
技术研发人员:赵亮刘贯伟刘秀武艳红
申请(专利权)人:恒银金融科技股份有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1