The embodiment of the invention discloses an English character segmentation method and device based on an object detection network, which can improve the accuracy of Chinese and English character segmentation in pictures. The method includes: S1, acquiring the image to be segmented, extracting the line area of English text from the image to be segmented; S2, inputting the line area of English text into the pre-trained object detection network, obtaining the segmentation result of the English character of the image to be segmented, in which the object detection network is training. The training samples used include indented adhesion samples, spread adhesion samples, visual angle adhesion samples and special effect adhesion samples.
【技术实现步骤摘要】
基于物体检测网络的英文字符切分方法及装置
本专利技术实施例涉及文字识别领域,具体涉及一种基于物体检测网络的英文字符切分方法及装置。
技术介绍
近些年来,与文字识别相关的领域受益于卷积神经网络得到更多的关注。一般而言,文字识别过程是由高层次的文字行到低层次的字符展开的。对于文字行的定位以及单个字符的识别过程均取得了令人瞩目的效果,从文字行区域得到单个字符区域不可或缺的需要字符切分工作,然而与文字切分相关的工作仍发展缓慢,成为目前限制文字识别效果的一项主要因素。提高字符切分的精度可以解决目前文字识别过程中存在的短板,大幅度提高文字识别效率,以应用于智能的文字信息获取,助力于实现更便捷的图文信息的相互转化。文字行中字符的切分工作面临的主要难题是字符的粘连现象,尤其针对英文字符而言,粘连现象更是普遍存在。粘连现象描述的是文字行中字符的笔画重叠或是字符的区域重叠的这个问题。相互粘连的字符给切分工作带来了很大困难,传统方法在字符切分的效果上并不能令人满意。除了粘连现象以外,文字行中字符大小变化范围大、场景图片的倾斜与畸变、文字复杂的字体与艺术格式等状况也加大了字符切分的难度,寻找一种新的字符切分方法便显得尤为迫切且充满了挑战性。
技术实现思路
针对现有技术存在的不足和缺陷,本专利技术实施例提供一种基于物体检测网络的英文字符切分方法及装置。一方面,本专利技术实施例提出一种基于物体检测网络的英文字符切分方法,包括:S1、获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;S2、将所述英文文本行区域输入预先训练得到的物体检测网络,得到所述待切分的图片的英文字符的切分结果 ...
【技术保护点】
1.一种基于物体检测网络的英文字符切分方法,其特征在于,包括:S1、获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;S2、将所述英文文本行区域输入预先训练得到的物体检测网络,得到所述待切分的图片的英文字符的切分结果,其中,所述物体检测网络在训练时使用的训练样本包括缩进粘连样本、蔓延粘连样本、视角粘连样本和特效粘连样本。
【技术特征摘要】
1.一种基于物体检测网络的英文字符切分方法,其特征在于,包括:S1、获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;S2、将所述英文文本行区域输入预先训练得到的物体检测网络,得到所述待切分的图片的英文字符的切分结果,其中,所述物体检测网络在训练时使用的训练样本包括缩进粘连样本、蔓延粘连样本、视角粘连样本和特效粘连样本。2.根据权利要求1所述的方法,其特征在于,所述训练样本包括真实样本和人工合成样本。3.根据权利要求2所述的方法,其特征在于,所述物体检测网络在训练时将形状相似的字符合并作为一个类别,通过物体检测网络检测出每个类别的准确位置,从而完成字符的切分。4.根据权利要求1所述的方法,其特征在于,所述物体检测网络为FasterR-CNN或YOLOv3。5.一种基于物体检测网络的英文字符切分装置,其特征在于,包括:提取单元,用于获取待切分的图片,从所述待切分的图片中提取出英文文本行区域;输入单元,用于将所述英文文本行区域输入预先训练得到的物体检...
【专利技术属性】
技术研发人员:刘长松,左天佑,王言伟,彭良瑞,丁晓青,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。