【技术实现步骤摘要】
文本检测方法、文本识别方法及装置
[0001]本公开涉及人工智能
,具体为深度学习、计算机视觉
,可应用于光学字符识别(Optical Character Recognition,OCR)等场景,尤其涉及一种文检测方法、文本识别方法及装置。
技术介绍
[0002]随着人工智能技术的发展和普遍性应用,对图像中的文本内容进行识别的操作逐渐由人工识别替换为智能识别,而确定用于框选图像中的文本内容的包围盒是对文本内容进行识别的前置过程。
[0003]在现有技术中,文本检测的方法通常基于“人工标注+文字预测”的实现,如通过人工的方式对包围盒进行标注,并对包围盒中的文字进行预测,从而得到与待检测文本对应的文本内容。
[0004]但是,由于人工标注容易受到人为主观因素的影响,从而导致文本检测的准确性偏低的技术问题。
技术实现思路
[0005]本公开提供了一种用于提高文本检测准确性的文本检测方法、文本识别方法及装置。
[0006]根据本公开的第一方面,提供了一种文本检测方法,包括: >[0007]获取待本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种文本检测方法,包括:获取待识别图像中文本条的图像特征;并对所述待识别图像进行视觉增强处理,得到所述待识别图像的增强特征图,其中,所述增强特征图为表征所述待识别图像的特征向量的特征图;对所述文本条的图像特征与所述增强特征图进行相似性比对,得到在所述增强特征图上的所述文本条的目标包围盒。2.根据权利要求1所述的方法,其中,对所述文本条的图像特征与所述增强特征图进行相似性比对,得到在所述增强特征图中的所述文本条的目标包围盒,包括:将所述文本条的图像特征与所述增强特征图进行相似性比对,以确定在所述增强特征图上的所述文本条的响应区域,所述响应区域表征所述文本条在所述增强特征图上的位置区域;根据在所述增强特征图上的所述文本条的响应区域,确定在所述增强特征图上的所述文本条的目标包围盒。3.根据权利要求2所述的方法,其中,所述文本条的图像特征中包括所述文本条中的像素点的图像特征;所述增强特征图中包括像素点的特征向量;将所述文本条的图像特征与所述增强特征图进行相似性比对,以确定在所述增强特征图上的所述文本条的响应区域,包括:将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行相似性比对,得到在所述增强特征图上的所述文本条的响应区域。4.根据权利要求3所述的方法,其中,将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行相似性比对,得到在所述增强特征图上的所述文本条的响应区域,包括:针对所述文本条中的像素点,将所述文本条中的像素点的图像特征、以及所述文本条中的像素点对应于增强特征图的特征向量进行相似性比对,得到相似度,并根据所述相似度确定在所述增强特征图上的所述文本条的响应区域。5.根据权利要求4所述的方法,其中,根据所述相似度确定在所述增强特征图上的所述文本条的响应区域,包括:根据所述相似度,从所述增强特征图中确定相似度大于预设相似度阈值的像素点,并根据确定出的相似度大于预设相似度阈值的像素点,确定在所述增强特征图上的所述文本条的响应区域。6.根据权利要求5所述的方法,其中,像素点具有位置属性;根据确定出的相似度大于预设相似度阈值的像素点,确定在所述增强特征图上的所述文本条的响应区域,包括:根据确定出的相似度大于预设相似度阈值的像素点在所述增强特征图中的位置属性,确定在所述增强特征图上的所述文本条的响应区域;以及,根据在所述增强特征图上的所述文本条的响应区域,确定所述文本条的目标包围盒,包括:对所述文本条的响应区域进行图像连通域处理,生成所述文本条的目标包围盒。7.根据权利要求3所述的方法,其中,将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行相似性比对,得到在所述增强特征图上的所述文本条
的响应区域,包括:针对所述文本条中的任意像素点,将所述任意像素点的图像特征、与所述增强特征图中的各像素点的特征向量分别进行相似性比对,得到各相似度,并根据各相似度生成在所述增强特征图上的所述文本条的响应区域。8.根据权利要求7所述的方法,其中,根据各相似度生成在所述增强特征图上的所述文本条的响应区域,包括:从各相似度中,确定大于预设相似度阈值的相似度,并确定大于预设相似度阈值的相似度中,对应的所述文本条中的像素点、与特征向量的像素点为相同的像素点的相似度;根据相同的像素点的相似度,生成在所述增强特征图上的所述文本条的响应区域。9.根据权利要求8所述的方法,其中,像素点具有位置属性;根据相同的像素点的相似度,生成在所述增强特征图上的所述文本条的响应区域,包括:根据相同的像素点在所述增强特征图中的位置属性,确定在所述增强特征图上的所述文本条的响应区域;以及,根据在所述增强特征图上的所述文本条的响应区域,确定在所述增强特征图上的所述文本条的目标包围盒,包括:对所述文本条的响应区域进行图像连通域处理,生成在所述增强特征图上的所述文本条的目标包围盒。10.根据权利要求1
‑
9任一项所述的方法,其中,获取待识别图像中文本条的图像特征,包括:获取所述待识别图像的图像特征,并根据所述待识别图像的图像特征确定所述待识别图像的初始包围盒,其中,所述初始包围中包括文本条。11.一种文本检测模型的训练方法,包括:获取样本图像中文本条的图像特征;并对所述样本图像进行视觉增强处理,得到所述样本图像的增强特征图,其中,所述增强特征图为表征所述样本图像的特征向量的特征图;对所述文本条的图像特征与所述增强特征图进行相似性比对,得到在所述增强特征图上的所述文本条的预测包围盒,并根据所述预测包围盒训练文本检测模型,所述文本检测模型用于获取待识别图像的目标包围盒。12.根据权利要求11所述的方法,其中,对所述文本条的图像特征与所述增强特征图进行相似性比对,得到在所述增强特征图上的所述文本条的预测包围盒,包括:将所述文本条的图像特征与所述增强特征图进行相似性比对,以确定在所述增强特征图上的所述文本条的响应区域,所述响应区域表征所述文本条在所述增强特征图上的位置区域;根据在所述增强特征图上的所述文本条的响应区域,确定在所述增强特征图上的所述文本条的预测包围盒。13.根据权利要求12所述的方法,其中,所述文本条的图像特征中包括所述文本条中的像素点的图像特征;所述增强特征图中包括像素点的特征向量;将所述文本条的图像特征与所述增强特征图进行相似性比对,以确定在所述增强特征图上的所述文本条的响应区域,包括:将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行
相似性比对,得到在所述增强特征图上的所述文本条的响应区域。14.根据权利要求13所述的方法,其中,将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行相似性比对,得到在所述增强特征图上的所述文本条的响应区域,包括:针对所述文本条中的像素点,将所述文本条中的像素点的图像特征、以及所述文本条中的像素点对应于增强特征图的特征向量进行相似性比对,得到相似度,并根据所述相似度确定在所述增强特征图上的所述文本条的响应区域。15.根据权利要求13所述的方法,其中,将所述文本条中的像素点的图像特征、与所述增强特征图中的像素点的特征向量进行相似性比对,得到在所述增强特征图上的所述文本条的响应区域,包括:针对所述文本条中的任意像素点,将所述任意像素点的图像特征、与所述增强特征图中的各像素点的特征向量分别进行相似性比对,得到各相似度,并根据各相似度生成在所述增强特征图上的所述文本条的响应区域。16.一种文本识别方法,包括:获取待识别图像,并获取待识别图像的包围盒,其中,所述包围盒中包括文本条,所述包围盒是基于如权利要求1
‑
10任一项所述的方法获取到的,或者,所述包围盒是基于预设文本检测模型获取到的,所述文本检测模型是基于权利要求11所述的方法训练生成的;对所述包围盒进行识别处理,得到所述待识别图像的文本内容。17.一种文本检测装置,包括:第一获取单元,用于获取待识别图像中文本条的图像特征;第一增强单元,用于对所述待识别图像进行视觉增强处理,得到所述待识别图像的增强特征图,其中,所述增强特征图为表征所述待识别图像的特征向量的特征图;第一比对单元,...
【专利技术属性】
技术研发人员:章成全,吕鹏原,范森,姚锟,韩钧宇,刘经拓,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。