【技术实现步骤摘要】
基于改进型EAST算法的文本检测方法
本专利技术涉及一种基于改进型EAST算法的文本检测方法,该方法适用于身份证文字识别、银行卡文字识别、电子票据文字识别、印刷体文档文字识别、自然场景文字识别等OCR文字识别领域。
技术介绍
OCR(OpticalCharacterRecognition)光学字符识别是AI领域的一项重要技术,主要内容是让计算机读取图像中的文字信息。当今主流的OCR技术主要分为两步:1、文本检测,指的是定位出文本在图像中的精确位置;2、文本识别,指的是根据文本检测提供的位置信息将文本裁剪出来并加以识别。现有OCR领域,文本检测技术多如牛毛,性能良好的检测技术主要都是基于深度神经网络,它们的区别仅在于网络的结构和其他的细枝末节。目前比较流行的文本检测技术有CTPN、TextBoxes、EAST、PixelLink等,它们都有各自的优缺点,比如CTPN算法的优点是对水平文本的检测精度高,缺点是无法检测倾斜的文本;EAST文本检测算法虽然可以定位倾斜的文本,但是无法精确定位较长的文本。
技术实现思路
本专利技术的目的在于提供一种基于改进型EAST算法的文本检 ...
【技术保护点】
1.一种基于改进型EAST算法的文本检测方法,其特征在于,它包括以下步骤:S1.采用多通道全卷积网络对输入图像进行处理,输出一个9通道特征图,分别为map0,map1,map2,map3,map4,map5,map6,map7,map8;S2.对map0中的像素点进行阈值化选择,将符合阈值范围的像素点选定作为激活像素点;S3.在map1‑map8上分别找到激活像素点对应的坐标,并计算出激活像素点所预测文本框的四个顶点坐标;S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon,多边形polygon对应的所有激活像素点组成一个集合C;S5.从集合C中筛选 ...
【技术特征摘要】
1.一种基于改进型EAST算法的文本检测方法,其特征在于,它包括以下步骤:S1.采用多通道全卷积网络对输入图像进行处理,输出一个9通道特征图,分别为map0,map1,map2,map3,map4,map5,map6,map7,map8;S2.对map0中的像素点进行阈值化选择,将符合阈值范围的像素点选定作为激活像素点;S3.在map1-map8上分别找到激活像素点对应的坐标,并计算出激活像素点所预测文本框的四个顶点坐标;S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon,多边形polygon对应的所有激活像素点组成一个集合C;S5.从集合C中筛选出靠近对应的预测文本框起始端的激活像素点形成子集合C1以及靠近对应的预测文本框终止端的激活像素点形成子集合C2;S6.通过子集合C1内的激活像素点计算出文本框起始端的两顶点坐标,通过子集合C2内的激活像素点计算出文本框终止端的两顶点坐标;将子集合C1得到的两顶点坐标与子集合C2得到的两顶点坐标进行合并,形成最终文本框的四个顶点坐标。2.根据权利要求1所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S4中,计算两激活像素点预测文本框的IoU值,当IoU值大于指定阈值时,将两预测文本框进行合并,并将对应的激活像素点归入集合C内。3.根据权利要求2所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S4中,IoU指定阈值的取值范围为(0.3,1)。4.根据权利要求1所述的基于改进型EAST算法的文本检测方法,其特征在于:步骤S5中,求集合C中每个激活像素点到其预测文本框起始端两顶点的曼哈顿距离之和dist1与集合C中每个激活像素点到其预测文本框终止端两顶点的曼哈顿距离之和dist2的比值ra...
【专利技术属性】
技术研发人员:史天永,翁增仁,
申请(专利权)人:福建博思软件股份有限公司,
类型:发明
国别省市:福建,35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。