【技术实现步骤摘要】
一种针对文本中单个字符目标的检测方法
本专利技术涉及人工智能
领域,特别是涉及一种针对文本中单个字符目标的检测方法。
技术介绍
现有的文本识别方法主要是通过基于深度学习的OCR技术来实现的,具体包括下列步骤:(1)对图片进行去噪、倾斜矫正等预处理操作,该步骤为可选操作;(2)采用基于深度学习的文本检测模型对图片进行检测;(3)根据步骤2检测到的文本区域对图片进行裁剪,得到一个或多个字符区域;(4)采用基于深度学习的文本识别模型对字符区域进行识别,得到文字识别结果。由于现有技术的实现主要是通过基于深度学习的OCR技术,这种基于深度卷积神经网络等方法,需要对图像进行卷积、池化等下采样处理,以便进行特征提取。然而在大量的下采样过程中,随着图片尺度的逐渐变小,在图片中本就占比很小的单个字符目标可能会有“丢掉”的风险,导致字符漏检。然而,在实际的工程应用中,这些单个的字符目标可能往往是所需要识别的关键目标。如何避免单个字符目标漏检成为急需解决的技术问题。因此,针对以上问题,提供一种针对文本中单个字符目标的检测方法具有重要
【技术保护点】
1.一种针对文本中单个字符目标的检测方法,其特征在于,包括如下步骤:/nS1、获取待检测的图像;/nS2、采用基于深度学习的目标检测模型检测图像,判断文本区域是否存在,若存在则记录此条标志为1,提取图像文本区域;若不存在则记录此条标志为0,并保存相关图片,进入统计分析流程;/nS3、采用基于深度学习的文本检测模型检测图片文本区域图像,判断文本实例区域是否存在,若存在则记录此条标志为1,提取一个或多个文本实例区域,以及文本实例的目标检测框的信息;若不存在则记录此条标志为0,并保存相关图片,进入统计分析流程;/nS4、对一个或多个文本实例区域进行竖直投影,若存在字符间距超过一定 ...
【技术特征摘要】
1.一种针对文本中单个字符目标的检测方法,其特征在于,包括如下步骤:
S1、获取待检测的图像;
S2、采用基于深度学习的目标检测模型检测图像,判断文本区域是否存在,若存在则记录此条标志为1,提取图像文本区域;若不存在则记录此条标志为0,并保存相关图片,进入统计分析流程;
S3、采用基于深度学习的文本检测模型检测图片文本区域图像,判断文本实例区域是否存在,若存在则记录此条标志为1,提取一个或多个文本实例区域,以及文本实例的目标检测框的信息;若不存在则记录此条标志为0,并保存相关图片,进入统计分析流程;
S4、对一个或多个文本实例区域进行竖直投影,若存在字符间距超过一定阈值时,则对文本实例区域进行裁剪,得到更为切合的多个文本实例区域;
S5、采用基于深度学习的文本识别模型依次识别S4步骤中处理后的一个或多个文本文本实例区域;获取文本识别结果;
S6、遍历按行、列划分后的文本识别结果,根据关键字进行文本匹配,提取所需的关键信息;并对关键信息进行后续的规则审判;若满足相关规则,则记录此条标志为1;若不满足则记录此条标志为0,进入统计分析流程;
S7、对整个过程的动作结果进行统计分析,记录标志位全...
【专利技术属性】
技术研发人员:谷维鑫,彭靖田,
申请(专利权)人:上海品览数据科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。