【技术实现步骤摘要】
图像中文本检测方法、装置、电子设备以及计算机介质
本申请涉及图像处理
,具体涉及计算机视觉
,尤其涉及一种图像中文本检测方法、装置、电子设备以及计算机可读介质。
技术介绍
日常生活中增值税发票、医疗收费票据等票据均需盖有印章,才能用于报销流程。印章中一般刻有企业名称、印章类型以及印章编号等信息,一般包含两类文字行:弯曲文字行、直线型文字行。现有的图像检测技术,通常是对图像中水平或垂直等常规中文文字进行检测,对于票据图像中混合了弯曲和非弯曲的复杂文字行位置的检测手段较少。
技术实现思路
提供了一种图像中文本检测方法、装置、电子设备以及计算机可读介质。根据第一方面,提供了一种图像中文本检测方法,上述方法包括:确定标注图像中的标注模板以及标注模板中的文本行;基于标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,得到文字标注样本;基于文字标注样本,对文本检测模型训练,得到训练完成的文本检测模型,训练完成的文本检测模型输入为图像,输出为图像中文本行的位置信息;采用训练完成的文本检测模型对待测图像中的文本行进行预测,得到训练完成的文本检测模型输出的待测图像中的文本行的位置信息。根据第二方面,提供了一种图像中文本检测装置,该装置包括:确定单元,被配置成确定标注图像中的标注模板以及标注模板中的文本行;得到单元,被配置成基于标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,得到文字标注样本;训练单元,被配置成基于文字标注样本,对文本检测模型训练 ...
【技术保护点】
1.一种图像中文本检测方法,包括:/n确定标注图像中的标注模板以及所述标注模板中的文本行;/n基于所述标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,得到文字标注样本;/n基于所述文字标注样本,对文本检测模型训练,得到训练完成的文本检测模型,所述训练完成的文本检测模型输入为图像,输出为图像中文本行的位置信息;/n采用所述训练完成的文本检测模型对待测图像中的文本行进行预测,得到所述训练完成的文本检测模型输出的所述待测图像中的文本行的位置信息。/n
【技术特征摘要】
1.一种图像中文本检测方法,包括:
确定标注图像中的标注模板以及所述标注模板中的文本行;
基于所述标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,得到文字标注样本;
基于所述文字标注样本,对文本检测模型训练,得到训练完成的文本检测模型,所述训练完成的文本检测模型输入为图像,输出为图像中文本行的位置信息;
采用所述训练完成的文本检测模型对待测图像中的文本行进行预测,得到所述训练完成的文本检测模型输出的所述待测图像中的文本行的位置信息。
2.根据权利要求1所述的方法,其中,所述文本行包括:弯曲文本行;所述标注模板轮廓的形状为圆形或椭圆;
所述基于所述标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,包括:
对所述弯曲文本行进行分段,得到两段以上文字行;
基于所述两段以上文字行,确定每段文字行对应的多边形标注框,以使一个多边形标注框框选一个文字行,其中,相邻两个多边形标注框互不交叉,且每个多边形标注框与所述标注模板轮廓具有至少两个交点。
3.根据权利要求2所述的方法,其中,所述文本行还包括:直线文本行;所述基于所述标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行中的文字,还包括:
在所述直线文本行位于所述标注模板轮廓中心时,确定所述直线文本行对应的最小外接矩形标注框,以使所述最小外接矩形标注框框选所述直线文本行。
4.根据权利要求1所述的方法,其中,所述基于所述文字标注样本,对文本检测模型训练,得到训练完成的文本检测模型,包括:
设置多组训练参数;
针对每组训练参数,将所述文字标注样本输入文本检测模型,以使所述文本检测模型按该组训练参数进行训练;
在各组训练参数对应的文本检测模型均训练完成之后,获取各组训练参数对应的文本检测模型的评价指标;
将所有文本检测模型的评价指标进行由高至低排名;
将评价指标排名最高的文本检测模型,作为训练完成的文本检测模型。
5.根据权利要求4所述的方法,其中,所述基于所述文字标注样本,对文本检测模型训练,得到训练完成的文本检测模型,还包括:
在所述文本检测模型按该组训练参数进行训练时,采用网格搜索算法和/或贝叶斯优化算法优化所述文本检测模型。
6.一种图像中文本检测装置,包括:
确定单元,被配置成确定标注图像中的标注模板以及所述标注模板中的文本行;
得到单元,被配置成基于所述标注模板轮廓的形状,采用至少一个多边形标注框标注所有文本行...
【专利技术属性】
技术研发人员:杜泓江,庞敏辉,谢国斌,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。