一种金融票据小写金额手写字符的分割方法技术

技术编号:25186745 阅读:16 留言:0更新日期:2020-08-07 21:14
本发明专利技术公开了一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:步骤01,利用K‑means算法,对输入的灰度图像寻找最优的分割阈值;步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。

【技术实现步骤摘要】
一种金融票据小写金额手写字符的分割方法
本专利技术涉及薄片类纸质介质处理领域,特别是涉及一种金融票据处的小写金额处手写字符的分割方法。
技术介绍
目前市面上各个人工智能公司的字符处理软件产品种类繁多,尤其在字符分割、识别技术已经相当成熟。但在金融票据上小写金额处、大写金额处等特定识别场景下的应用效果并不理想。字符的种类分为印刷体数字(0~9)、手写体数字、印刷体大小写英文字母(a~w)、手写体大小写英文字符、印刷体特殊符号及手写体特殊符号(如¥、$)等。印刷体字符识别一般采用较为简单的三层全连接神经网络算法,即可获得较好的识别结果。而手写体字符识别则需要更深层的卷积神经网络算法。无论采用哪种算法,在识别之前,都需要对每块字符依次分割出单个字符,而字符切割的字体规范性是识别正确的前提,因此字符的分割对算法识别结果产生较大影响。一般印刷体字符的字体、形状、大小较为规范,字符之间的间距也非常均匀,使用传统的横向投影、纵向投影分割方法,结合动态阈值等处理技术,即可获得较好的分割效果。而手写体字符形状、大小等特征往往因个人笔法而异,字符的连笔、粘连等情况非常普遍,尤其是在票据上小写金额处的手写体数字,每个数字分割的难度不仅在于手写字符的不规范,还在于外侧的货币数字栅格,以及字迹经长时间保存变得模糊、墨迹暗淡也会带来一定的困难。针对此类字符的分割,传统的横、纵向投影算法,以及深度学习神经网络分割方法均难以达到良好效果,金额处的栅格极易误识别为其它字符(例如数字1),而一些手写体票据的数字会超出栅格范围,这都会给字符的有效分割带来很大挑战。
技术实现思路
为了解决上述技术问题,本专利技术提出一种票据小写金额手写字符分割方法,提出三步识别机制,首先采用K-means聚类算法,对输入的灰度图像寻找最优的分割阈值。获得最优阈值后,再使用直方图法对待识别字符样本进行横、纵投影分割,获得初步的字符分割序列,最后将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,此方法最大程度上排除栅格线对字符分割的干扰,提高字符分割的效率。为实现本专利技术的目的所采用的技术方案是:一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:步骤01,利用K-means算法,对输入的灰度图像寻找最优的分割阈值;步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。更进一步地,所述步骤01包括如下步骤:步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。更进一步地,所述步骤013中最优分割阈值是当E取最小值时,x的值,计算公式为:其中μi是数据对象Ci的均值向量,表达式为:更进一步地,所述步骤02包括如下步骤:步骤021,使用步骤01中获得的最优分割阈值,对待识别的票据小写金额处的字符图像进行二值化去背景处理;步骤022,把字符图像进行水平投影,得到的字符在垂直方向上的像素分布,再对字符图像进行水平投影,得到水平方向的像素分布;步骤023,综合垂直方向和水平方向的投影的区域位置,通过遍历黑白像素矩阵,获得初步的字符区的精确分割。更进一步地,所述步骤03包括如下步骤:步骤031,基于VGG16神经网络结构,采用U-Net作为解码器,输入为步骤02分割后的初步字符分割序列;步骤032,输出分为两个通道,一个通道的输出结果为RegionScore,表示对应每个字符处于文字中心的概率,即字符区域置信度,用于定位图像中的独立字符区域,另一个通道的输出结果为AffinityScore,认为对应每个字符是两个字之间的中心概率,即关联系数;步骤033,分割出的栅格线等干扰成分的字符区域置信度及关联系数明显低于手写数字字符,剔除干扰成分后,即可获得最优字符分割序列。本专利技术的有益效果是:本专利技术提供了一种金融票据小写金额手写字符分割方法,并且测试结果也验证了方法的正确性,使用K-means算法获得最优分割阈值,直方图法完成初级分割序列,再经过CRAFT算法筛选出最优字符分割序列,可以满足票据小写金额处字符分割准确率的要求。附图说明图1为字符分割处理过程;图2为CRAFT网络结构图;图3为K-means方法和直方图法完成字符初级分割结果;图4为CRAFT算法筛选出的最优字符分割序列。具体实施方式以下结合附图和具体实施例对本专利技术作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。一种金融票据小写金额手写字符分割方法,分为三个步骤:第一步:利用K-means算法,对输入的灰度图像寻找最优的分割阈值;步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。所述步骤013中最优分割阈值是当E取最小值时,x的值,计算公式为:其中μi是数据对象Ci的均值向量,表达式为:初始聚类中心的来源:K-means算法分割最优阈值实现,选取票据彩色图像的小写金额ROI区域,计算OSTU阈值并进行二值化阈值分割,获得满足条件像素点阵,进一步计算得到k个像素簇的粗中心。第二步:利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;步骤021,使用步骤01中获得的最优分割阈值,对待识别的票据小写金额处的字符图像进行二值化去背景处理步骤022,把字符图像进行水平投影,得到的字符在垂直方向上的像素分布,再对字符图像进行水平投影,得到水平方向的像素分布;步骤023,综合垂直方向和水平方向的投影的区域位置,通过遍历黑白像素矩阵,获得初步的字符区的精确分割。第三步:CRAFT算法筛选出最优字符分割序列:将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而本文档来自技高网
...

【技术保护点】
1.一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:/n步骤01,利用K-means算法,对输入的灰度图像寻找最优的分割阈值;/n步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;/n步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。/n

【技术特征摘要】
1.一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:
步骤01,利用K-means算法,对输入的灰度图像寻找最优的分割阈值;
步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;
步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。


2.根据权利要求1所述的一种金融票据小写金额手写字符的分割方法,其特征在于,所述步骤01包括如下步骤:
步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;
步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;
步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。


3.根据权利要求2所述的一种金融票据小写金融手写字符的分割方法,其特征在于,所述步骤013中最优分割阈值是当E取最小值时,x的值,计算公式为:



其中μi是数据对象Ci的...

【专利技术属性】
技术研发人员:刘贯伟张振彬江浩然张云峰
申请(专利权)人:恒银金融科技股份有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1