文本标注方法、装置、电子装置和存储介质制造方法及图纸

技术编号:37506597 阅读:29 留言:0更新日期:2023-05-07 09:43
本申请涉及一种文本标注方法、装置、电子装置和存储介质,其中,该文本标注方法包括:根据确定的目标像素特征和笔画识别规则,对待识别图像进行文字识别,得到待识别图像中的文字对象;将符合预设的文字排布规则的文字对象组成的区域识别为连续文字区域,对连续文字区域进行标注,得到文本标注结果。其基于设定的识别规则实现了文字对象和连续文字的逐级识别,进而完成文本内容的标注,无需依赖人工标注,节省了文本标注的人工成本,提高了文本标注的效率和质量。效率和质量。效率和质量。

【技术实现步骤摘要】
文本标注方法、装置、电子装置和存储介质


[0001]本申请涉及图像处理领域,特别是涉及文本标注方法、装置、电子装置和存储介质。

技术介绍

[0002]随着科技的发展,光学字符识别(optical character recognition,简称OCR)技术在证件检测、广告牌检测中得到了广泛应用。目前的文字识别技术,往往需要用户预先手动对文本内容进行标注后,再基于OCR技术对目标文字进行识别。然而,手动进行文本标注需要耗费较多人力和财力,因此人工成本较高,并且,人工标注的精准度也将直接影响到后续文字识别结果的精确度。基于此,目前的文本标注的效率和质量较低。
[0003]针对相关技术中存在人工进行文本标注的效率和质量较低的问题,目前还没有提出有效的解决方案。

技术实现思路

[0004]在本实施例中提供了一种文本标注方法、装置、电子装置和存储介质,以解决相关技术中人工进行文本标注的效率和质量较低的问题。
[0005]第一个方面,在本实施例中提供了一种文本标注方法,包括:
[0006]根据确定的目标像素特征和笔画本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本标注方法,其特征在于,包括:根据确定的目标像素特征和笔画识别规则,对待识别图像进行文字识别,得到所述待识别图像中的文字对象;将符合预设的文字排布规则的文字对象组成的区域识别为连续文字区域,对所述连续文字区域进行标注,得到文本标注结果。2.根据权利要求1所述的文本标注方法,其特征在于,所述根据确定的目标像素特征和笔画识别规则,对待识别图像进行文字识别,得到所述待识别图像中的文字对象,包括:将用户在所述待识别图像中选定的识别位置处的像素特征,确定为目标像素特征;根据所述目标像素特征、确定的笔画宽度以及预设的笔画间距,以所述识别位置为中心,对所述待识别图像进行文字识别,得到所述待识别图像中的文字对象。3.根据权利要求2所述的文本标注方法,其特征在于,所述根据所述目标像素特征、确定的笔画宽度以及预设的笔画间距,以所述识别位置为中心,对所述待识别图像进行文字识别,得到所述待识别图像中的文字对象,包括:以所述识别位置为中心,寻找与所述目标像素特征匹配的连续的像素区域,得到目标连续区域;基于所述确定的笔画宽度和所述预设的笔画间距,从所述目标连续区域中识别到笔画对象,基于所述笔画对象得到位于所述识别位置处的文字对象;依次以已识别到的文字对象的左右边界的中点为中心,确定所述待识别图像中与所述目标像素特征匹配的其他连续的像素区域,并基于所述笔画宽度和所述笔画间距,从所述其他连续的像素区域中识别到,位于其他位置的文字对象。4.根据权利要求3所述的文本标注方法,其特征在于,所述基于所述确定的笔画宽度和所述预设的笔画间距,从所述目标连续区域中识别到笔画对象,基于所述笔画对象得到位于所述识别位置处的文字对象,包括:从所述目标连续区域中识别到宽度与所述确定的笔画宽度匹配的笔画对象;基...

【专利技术属性】
技术研发人员:熊琛
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1