基于改进CRAFT的文本检测方法及装置制造方法及图纸

技术编号:27879896 阅读:12 留言:0更新日期:2021-03-31 01:12
本申请公开了一种基于改进CRAFT的文本检测方法及装置。该基于改进CRAFT的文本检测方法包括将待检测图片进行裁剪,得到裁剪图片集;计算裁剪图片集的特征图,得到裁剪特征图集,其中,特征图包括单字位置信息和字间连接信息;将裁剪特征图集根据裁剪图片集对应待检测图片的位置进行拼接,得到待检测图片对应的待检测特征图;根据单字位置信息和字间连接信息,检测待检测特征图上的文本区域,并输出文本区域的位置。本申请解决了在检测大尺寸图片时GPU内存占用过高的技术问题。

【技术实现步骤摘要】
基于改进CRAFT的文本检测方法及装置
本申请涉及文本检测领域,具体而言,涉及一种基于改进CRAFT的文本检测方法及装置。
技术介绍
随着人工智能进程的不断发展,自然场景下的文字识别也成为了该进程中不可或缺的一环。而在文字识别之前需要对文字进行检测,相关技术中通常使用CTPN(ConnectionistTextProposalNetwork)和CRAFT(CharacterRegionAwarenessforTextDetection)进行文字检测,但是CTPN不能识别弯曲的文字,大量的阈值设置,网络文本检测的鲁棒性不强,不能检测太大的图片,检测大尺寸图片时GPU内存占用过高,容易导致部署在同一块GPU的其他应用崩溃;CRAFT检测算法虽然克服CTPN不能检测任意排列的文字、阈值设置大等的问题,但同样在检测大尺寸图片时GPU内存占用过高。针对相关技术中在检测大尺寸图片时GPU内存占用过高的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种基于改进CRAFT的文本检测方法,以解决在检测大尺寸图片时GPU内存占用过高问题。为了实现上述目的,本申请提供了一种基于改进CRAFT的文本检测方法及装置。第一方面,本申请提供了一种基于改进CRAFT的文本检测方法。根据本申请的基于改进CRAFT的文本检测方法包括:将待检测图片进行裁剪,得到裁剪图片集;计算所述裁剪图片集的特征图,得到裁剪特征图集,其中,所述特征图包括单字位置信息和字间连接信息;将所述裁剪特征图集根据裁剪图片集对应待检测图片的位置进行拼接,得到待检测图片对应的待检测特征图;根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域,并输出所述文本区域的位置。进一步的,所述根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域包括:根据单字位置信息和字间连接信息,将所述待检测特征图进行降噪处理,得到降噪特征图;检测所述降噪特征图的轮廓,并生成轮廓对应的正外接矩形;根据所述正外接矩形确定文本区域。进一步的,所述将所述待检测特征图进行降噪处理,得到降噪特征图包括:对所述待检测图片的热力图中的通道降噪,得到降噪特征图,其中,所述热力图为高斯分布。进一步的,所述对所述待检测图片的热力图中的通道降噪,得到降噪特征图包括:对所述热力图的第一通道和第二通道进行相加,得到特征叠加图,其中,所述热力图的第一通道包含单字位置的特征信息,所述热力图的第二通道包含字间连接的特征信息;将所述特征叠加图通过二值化进行降噪处理,得到降噪后的降噪特征图。进一步的,所述将待检测图片进行裁剪包括:将待检测图片按照预设边长进行裁剪,判断裁剪后的图片边长是否大于最小裁剪边长;若大于最小裁剪边长,则继续按照预设边长进行裁剪;若小于最小裁剪边长,则不继续进行裁剪。进一步的,在所述将待检测图片进行裁剪,得到裁剪图片集之前,所述方法还包括:根据预设像素标准差和预设像素均值对待检测图片的像素进行标准化处理。第二方面,本申请提供了一种基于改进CRAFT的文本检测装置。根据本申请的基于改进CRAFT的文本检测装置包括:图片裁剪模块,用于将待检测图片进行裁剪,得到裁剪图片集;特征获取模块,用于计算所述裁剪图片集的特征图,得到裁剪特征图集,其中,所述特征图包括单字位置信息和字间连接信息;特征拼接模块,用于将所述裁剪特征图集根据裁剪图片集对应待检测图片的位置进行拼接,得到待检测图片对应的待检测特征图;文本检测模块,用于根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域,并输出所述文本区域的位置。进一步的,所述文本检测模块包括:降噪处理单元,用于根据单字位置信息和字间连接信息,将所述待检测特征图进行降噪处理,得到降噪特征图;轮廓检测单元,用于检测所述降噪特征图的轮廓,并生成轮廓对应的正外接矩形;文本确定单元,用于根据所述正外接矩形确定文本区域。进一步的,所述降噪处理单元还包括:用于对所述待检测图片的热力图中的通道降噪,得到降噪特征图,其中,所述热力图为高斯分布。进一步的,所述降噪处理单元还包括:用于对所述热力图的第一通道和第二通道进行相加,得到特征叠加图,其中,所述热力图的第一通道包含单字位置的特征信息,所述热力图的第二通道包含字间连接的特征信息;将所述特征叠加图通过二值化进行降噪处理,得到降噪后的降噪特征图。进一步的,所述图片裁剪模块包括:边长判断单元,用于将待检测图片按照预设边长进行裁剪,判断裁剪后的图片边长是否大于最小裁剪边长;继续裁剪单元,用于若大于最小裁剪边长,则继续按照预设边长进行裁剪;停止裁剪单元,用于若小于最小裁剪边长,则不继续进行裁剪。进一步的,所述基于改进CRAFT的文本检测装置还包括:图片预处理模块,用于根据预设像素标准差和预设像素均值对待检测图片的像素进行标准化处理。第三方面,本申请提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面提供的基于改进CRAFT的文本检测方法的步骤。第四方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面提供的基于改进CRAFT的文本检测方法的步骤。在本申请实施例中,采用裁剪待检测图片的方式,计算裁剪后图片的包含单字位置信息和字间连接信息的特征图,并根据裁剪图片集对应待检测图片的位置进行拼接,通过检测拼接后的特征图到达了文本检测的目的,从而实现了可检测任意大小的图片,节省了GPU的内存的技术效果,进而解决了在检测大尺寸图片时GPU内存占用过高的技术问题。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的基于改进CRAFT的文本检测方法的流程示意图;图2是根据本申请另一实施例的基于改进CRAFT的文本检测方法的流程示意图;图3是根据本申请实施例的基于改进CRAFT的文本检测装置的结构框图;图4是根据本申请实施例的电子设备框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一本文档来自技高网
...

【技术保护点】
1.一种基于改进CRAFT的文本检测方法,其特征在于,包括:/n将待检测图片进行裁剪,得到裁剪图片集;/n计算所述裁剪图片集的特征图,得到裁剪特征图集,其中,所述特征图包括单字位置信息和字间连接信息;/n将所述裁剪特征图集根据裁剪图片集对应待检测图片的位置进行拼接,得到待检测图片对应的待检测特征图;/n根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域,并输出所述文本区域的位置。/n

【技术特征摘要】
1.一种基于改进CRAFT的文本检测方法,其特征在于,包括:
将待检测图片进行裁剪,得到裁剪图片集;
计算所述裁剪图片集的特征图,得到裁剪特征图集,其中,所述特征图包括单字位置信息和字间连接信息;
将所述裁剪特征图集根据裁剪图片集对应待检测图片的位置进行拼接,得到待检测图片对应的待检测特征图;
根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域,并输出所述文本区域的位置。


2.根据权利要求1所述的基于改进CRAFT的文本检测方法,其特征在于,所述根据单字位置信息和字间连接信息,检测所述待检测特征图上的文本区域包括:
根据单字位置信息和字间连接信息,将所述待检测特征图进行降噪处理,得到降噪特征图;
检测所述降噪特征图的轮廓,并生成轮廓对应的正外接矩形;
根据所述正外接矩形确定文本区域。


3.根据权利要求2所述的基于改进CRAFT的文本检测方法,其特征在于,所述将所述待检测特征图进行降噪处理,得到降噪特征图包括:
对所述待检测图片的热力图中的通道降噪,得到降噪特征图,其中,所述热力图为高斯分布。


4.根据权利要求3所述的基于改进CRAFT的文本检测方法,其特征在于,所述对所述待检测图片的热力图中的通道降噪,得到降噪特征图包括:
对所述热力图的第一通道和第二通道进行相加,得到特征叠加图,其中,所述热力图的第一通道包含单字位置的特征信息,所述热力图的第二通道包含字间连接的特征信息;
将所述特征叠加图通过二值化进行降噪处理,得到降噪后的降噪特征图。


5.根据权利要求1所述的基于改进CRAFT的文本检测方法,其特征在于,所述将待检测图片进行裁剪包括:
将待检测图片按照预设边长进行裁剪,判断裁剪后的图片边长是否大于最小裁剪边长;
若大于最小裁剪边长,则继续按照预设边长进行...

【专利技术属性】
技术研发人员:范凌
申请(专利权)人:特赞上海信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1