【技术实现步骤摘要】
文本区域检测方法及设备
本申请涉及图像识别领域,尤其涉及一种文本区域检测方法及设备。
技术介绍
当前,光学字符识别技术用于让计算机自动识别图像中包含的文本字符,作为光学字符识别的基础,首先需要文本定位技术进行定位,即在图像中定位到文本字符所在的区域。定位文本区域目前多采用类似目标检测的定位分类方法,将文本区域作为图像中的检测目标来进行检测。该方法的问题在于要检测的文本区域大多为长边较长的矩形,宽高比分布较为极端,与通常目标检测中目标物体差别较大,目标物体的宽高比约在1左右,因此往往不能很好地检测出文本区域。另外,通常目标检测中的目标物体存在明显的闭合边缘轮廓,而文本区域并不存在明显的闭合边缘,从而导致使用现有目标检测方案对文本区域的图像特征进行提取时难以将文本字符与图像背景区分开来。
技术实现思路
本申请的一个目的是提供一种文本区域检测方法及设备,用于解决现有技术下文本区域检测的识别精度不高、定位效果不佳的问题。为实现上述目的,本申请提供了一种文本区域检测方法,其中,该方法包括:构 ...
【技术保护点】
1.一种文本区域检测方法,其中,该方法包括:/n构建文本区域检测模型,其中,所述文本区域检测模型通过角点检测确定角点并根据所述角点确定文本区域预测框;/n根据所述文本区域检测模型对待检测文本图像进行文本区域检测,确定相应的文本区域预测框,其中,所述文本区域具有不同的显示方向。/n
【技术特征摘要】
1.一种文本区域检测方法,其中,该方法包括:
构建文本区域检测模型,其中,所述文本区域检测模型通过角点检测确定角点并根据所述角点确定文本区域预测框;
根据所述文本区域检测模型对待检测文本图像进行文本区域检测,确定相应的文本区域预测框,其中,所述文本区域具有不同的显示方向。
2.根据权利要求1所述的方法,其中,构建文本区域检测模型,包括:
对样本文本图像进行特征提取,获取对应的特征图像;
对所述特征图像进行角点检测,确定所述样本文本图像中的角点,其中,所述角点的类型包括所述文本区域预测框的左上角点、右上角点、左下角点和右下角点;
对所述角点进行分类组合,根据分类组合结果确定文本区域预测框;
确定所述文本区域预测框与预先标注的文本区域识别框之间的差距,根据所述差距调整文本区域检测模型的参数;
在满足预设的模型训练停止条件时,将文本区域检测模型的当前参数确定为所述文本区域检测模型的最终参数。
3.根据权利要求2所述的方法,其中,对样本文本图像进行特征提取,获取对应的特征图像,包括:
将样本文本图像输入堆叠的多个沙漏网络,获取所述多个沙漏网络输出的特征图像,其中,所述沙漏网络包括卷积层、池化层、下采样层和上采样层。
4.根据权利要求2所述的方法,其中,对所述特征图像进行角点检测,确定所述样本文本图像中的角点,包括:
对特征图像进行卷积操作,获取卷积后特征图像;
对所述卷积后特征图像进行池化操作,获取对应不同类型角点的池化后特征图像;
根据所述对应不同类型角点的池化后特征图像,生成对应不同类型角点的热力图;
将所述对应不同类型角点的热力图中相应类型角点的激活响应超过预设阈值的位置确定为相应类型角点的位置;
根据所述对应不同类型角点的池化后的特征图像,确定相应类型角点对应的角点方向;
根据预设损失函数计算所述相应类型角点与预先标注的相应类型角点的信息差距,并根据预设优化方法对所述信息差距进行优化,确定优化后的相应类型角点。
5.根据权利要求4所述的方法,其中,所述对特征图像进行卷积操作中所使用卷积核的大小为3×5。
6.根据权利要求4所述的方法,其中,对所述卷积后特征图像进行池化操作,获取对应不同类型角点的池化后特征图像,包括:
获取所述卷积后特征图像中第一像素点;
遍历与所述第一像素点属于同一通道、同一行且位于预设水平方向上的其它像素点,将...
【专利技术属性】
技术研发人员:周康明,吴昊,
申请(专利权)人:上海眼控科技股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。