【技术实现步骤摘要】
一种中英混合OCR字符切割的方法及装置
本专利技术涉及一种字符分割方法,更具体的,涉及一种中英混合OCR字符切割的方法及装置。
技术介绍
现有技术中,OCR字符分割最简单的方法是投影法,但是该方法难以正确切割粘连字符。另外的一些改进方法采用了负责的处理流程以及手工设置的特定规则,但其规则只针对单种语言,未能很好处理中英双语混合的情形。现有技术中,作者为K.Wang,J.Jin,andQ.Wang发表的《Highperformancechinese/englishmixedocrwithcharacterlevellanguageidentification》,其字符分割流程框架如图1所示,该方法首先分别抽取出字符图像中包含中文字符与英文字符的区域,然后再对各自区域应用适配中文/英文字符切割的算法流程进行处理。但该方法实现复杂,难以调试。所以设计一种简单高效的字符切割方法是亟不可待的。
技术实现思路
本专利技术的目的就是提出一种流程简单、无需手动设置规则、适合中英混合情形的OCR字符切割技术。为实现上述目的,本专利技术提供了一种中英混合OCR字符切割的方法,该方法包括如 ...
【技术保护点】
一种中英混合OCR字符切割的方法,其特征在于,该方法包括如下步骤:步骤1,获取待切割的所述中英混合OCR字符图像;步骤2,模型的训练,通过对全卷积神经网络模型的训练,使所述模型能够正确预测所述图像中每个横坐标像素点的类别,所述类别为一个二分类任务,即将所述像素点分为切割点或非切割点;步骤3,模型的使用,通过后处理流程最终给出正确的字符切割点。
【技术特征摘要】
1.一种中英混合OCR字符切割的方法,其特征在于,该方法包括如下步骤:步骤1,获取待切割的所述中英混合OCR字符图像;步骤2,模型的训练,通过对全卷积神经网络模型的训练,使所述模型能够正确预测所述图像中每个横坐标像素点的类别,所述类别为一个二分类任务,即将所述像素点分为切割点或非切割点;步骤3,模型的使用,通过后处理流程最终给出正确的字符切割点。2.根据权利要求1所述的一种中英混合OCR字符切割的方法,其特征在于,在步骤2中采用后向传播算法训练所述全卷积神经网络。3.根据权利要求1或2所述的一种中英混合OCR字符切割的方法,其特征在于,所述步骤2进一步包括:如果所述像素点位置是所述切割点,则为正类,否则为负类。4.根据权利要求3所述的一种中英混合OCR字符切割的方法,其特征在于,在步骤3中所述后处理流程具体包括以下步骤:所述全卷积神经网络在每个横坐标像素点位置给出0到1之间的概率,按照阈值0.5进行二值化,变成0或1的分类;对于相邻的连续n个正类点,取它们的中点做为切割点,其余周边点即使也是合理的切割点,也选择丢弃;相邻两个切割点构成一个切割段,统计此段内的图像像素值分布,判断此段内是否为空白,如果是,选择丢弃;按照剩下的切割段切除图片块,从而完成字符切割。5.根据权利要求3所述的一种中英混合OCR字符切割的方法,其特征在于,在所述模型训练的过程中需要对不同类的损失函数动态施加不同的权重,具体做法是:初始化正类权重为0.9,负类权重为0.1,每次迭代后如果正类召回率高于负类召回率,则降低正类权重,增加负类权重,反之则增加正类权重,降低负...
【专利技术属性】
技术研发人员:郑华滨,潘嵘,王经宇,黄正杰,
申请(专利权)人:深圳爱拼信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。