一种字符分割方法及装置制造方法及图纸

技术编号:21060961 阅读:42 留言:0更新日期:2019-05-08 07:24
本发明专利技术实施例提供了一种字符分割方法及装置,涉及图像识别领域,其中,上述方法包括:确定待分割图像中字符的编组方式,作为第一编组方式;统计待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量;获得编组方式为第一编组方式的每一字符排布中字符像素点的第一预估数量分布;确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布;按照第二预估数量分布对应的字符排布对待分割图像进行字符分割。应用本发明专利技术实施例提供的方案进行字符分割时,能够提高字符分割的准确度。

【技术实现步骤摘要】
一种字符分割方法及装置
本专利技术涉及图像识别
,特别是涉及一种字符分割方法及装置。
技术介绍
在识别图像中所包含的数字、字母等字符时,往往需要先确定包含字符的图像区域,再对上述图像区域进行字符分割,确定单个字符所在区域,然后逐一对单个字符所在区域进行字符识别。其中,进行字符分割时,一般按照预设的尺寸对上述图像区域进行分割,将分割得到的各个区域作为单个字符所在区域。以银行卡图像为例,在现有技术中,从银行卡的图像中识别银行卡号时,可以先确定银行卡号所在的区域,再采用设置有字符预设尺寸的字符分割模板,从上述区域中逐一确定卡号中的每一个数字所在的区域,然后对每一个数字进行识别,得到银行卡号的识别结果。错误的字符分割会导致单个卡号数字的识别结果与真实情况大相径庭,银行卡号字符的分割精度直接关系到字符识别的准确度,是银行卡号识别成功与否的关键因素之一。专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:在实际应用场景中,不同银行卡的卡号数字大小不同,卡号数字之间间距不同;对于相同类型的银行卡,如果拍摄的方式不同,所得到的银行卡图像上的卡号数字大小、卡号数字之间间距也会不同;本文档来自技高网...

【技术保护点】
1.一种字符分割方法,其特征在于,包括:确定待分割图像中字符的编组方式,作为第一编组方式;统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;按照所述第二预估数量分布对应的字...

【技术特征摘要】
1.一种字符分割方法,其特征在于,包括:确定待分割图像中字符的编组方式,作为第一编组方式;统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,其中,每一字符排布中字符的字符宽度为预设宽度、字符组间距为预设间距,不同字符排布中字符宽度不同和/或字符组间距不同;确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,其中,所述第一分布为:由所统计得到的第一像素点数量确定的字符像素点数量的分布;按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割。2.根据权利要求1所述的方法,其特征在于,所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布,包括:按照以下方式获得每一字符排布中字符像素点的第一预估数量分布:获得字符排布中字符的字符宽度,作为第一宽度,并获得字符排布中字符的字符组间距,作为第一间距;基于所述第一宽度,确定单个字符中字符像素点的第三预估数量分布,其中,所述第三预估数量分布为:预设的预估数量分布集内宽度为所述第一宽度的第一图像的像素单元中字符像素点的数量分布,所述预估数量分布集为:与每一第二分布差异度最小的分布所构成的集合,所述第二分布为:所述第一图像的像素单元中字符像素点的数量分布,各个第一图像为:分别包含备选字符集中每一字符的、预设宽度的图像;按照所述第一编组方式,依次对所述第三预估数量分布和无字符分布进行组合,将组合结果作为字符排布的第一预估数量分布,其中,所述无字符分布为:宽度为所述第一间距的无字符图像的像素单元中字符像素点的数量分布。3.根据权利要求2所述的方法,其特征在于,所述获得字符排布中字符的字符组间距,作为第一间距,包括:获得用于表示字符组间距与字符宽度之间比例关系的第一数值;计算所述第一宽度和所述第一数值的乘积,得到字符排布中字符的字符组间距,作为第一间距。4.根据权利要求1所述的方法,其特征在于,所述确定所获得第一预估数量分布中与第一分布之间差异度最小的第一预估数量分布,作为第二预估数量分布,包括:按照以下表达式计算所获得的每一第一预估数量分布与第一分布之间的差异度:其中,D表示一第一预估数量分布与所述第一分布之间的差异度,i表示像素单元的标号,n表示像素单元的数量,yi表示第一预估数量分布中第i个元素的数值,xi表示所述第一分布中第i个像素单元中字符像素点的数量;确定计算得到的差异度中最小差异度对应的第一预估数量分布,作为第二预估数量分布。5.根据权利要求1-4项中任一所述的方法,其特征在于,在所述确定待分割图像中字符的编组方式之前,所述方法还包括:获得待进行字符识别的图像的灰度分量图像和色度分量图像;分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图;对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像。6.根据权利要求5所述的方法,其特征在于,所述对所述灰度分量梯度图和所述色度分量梯度图进行差运算,得到待分割图像,包括:对所述色度分量梯度图进行二值化处理,得到色度分量二值图;确定所述灰度分量梯度图中第一像素点的像素值为第一预设像素值,得到待分割图像,其中,所述第一预设像素值为:所表示的梯度值小于第一预设阈值的像素值,所述第一像素点为:与所述色度分量二值图中像素值为第二预设像素值的像素点相对应的、所述灰度分量梯度图中的像素点,所述第二预设像素值为:所述色度分量二值图中背景像素点的像素值。7.根据权利要求5所述的方法,其特征在于,在所述分别对所述灰度分量图像和所述色度分量图像进行形态学梯度化计算,得到灰度分量梯度图和色度分量梯度图之后,所述方法还包括:统计所述灰度分量梯度图的每一像素单元中字符像素点的数量,作为第二像素点数量;在所述获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量分布之后,所述方法还包括:确定所获得第一预估数量分布中与第三分布之间差异度最小的第一预估数量分布,作为第四预估数量分布,其中,所述第三分布为:由所述第二像素点数量确定的字符像素点数量的分布;按照所述第四预估数量分布对应的字符排布对所述灰度分量梯度图进行字符分割,得到第一分割区域;在所述按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割之后,所述方法还包括:分别将每一第一分割区域和每一第二分割区域输入至置信度模型中,得到每一第一分割区域、每一第二分割区域为单字符区域的置信度,其中,各个第二分割区域为:按照所述第二预估数量分布对应的字符排布对所述待分割图像进行字符分割得到的区域,所述置信度模型为:预先使用样本区域对预设的神经网络模型进行训练得到的、用于检测区域是否为单字符区域的二分类神经网络模型,所述样本区域为:对样本图像进行形态学梯度化计算得到的梯度图中高度为第一预设数量个像素点、宽度为第二预设数量个像素点的区域;计算各个第一分割区域的置信度的和值,并计算各个第二分割区域的置信度的和值;将计算得到的和值中最大和值对应的分割区域确定为所述待进行字符识别的图像的字符分割结果。8.根据权利要求7所述的方法,其特征在于,采用以下方式训练得到所述置信度模型:获取包含字符的样本图像;对所述样本图像的灰度分量进行形态学梯度化计算,得到样本梯度图;将第一图像区域划分成高度为第一预设数量个像素点、宽度为第二预设数量个像素点的单字符区域,作为正样本区域,其中,所述第一图像区域为:所述样本梯度图中与所述样本图像中包含字符的图像区域相对应的区域;在样本图像中对各个正样本区域进行偏移处理得到负样本区域;采用所述正样本区域和所述负样本区域对预设的神经网络模型进行训练,得到用于检测区域是否是为单字符区域的二分类神经网络模型,作为所述置信度模型。9.一种字符分割装置,其特征在于,包括:编组方式确定模块,用于确定待分割图像中字符的编组方式,作为第一编组方式;第一数量统计模块,用于统计所述待分割图像的每一像素单元中字符像素点的数量,作为第一像素点数量,其中,所述字符像素点为:属于字符的像素点;分布获得模块,用于获得编组方式为所述第一编组方式的每一字符排布中字符像素点的第一预估数量...

【专利技术属性】
技术研发人员:罗熹之
申请(专利权)人:上海众源网络有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1