基于改进型EAST算法的文本检测方法技术

技术编号：21090820 阅读：25 留言：0更新日期：2019-05-11 10:25

本发明专利技术涉及一种基于改进型EAST算法的文本检测方法，它包括以下步骤：S1.采用多通道全卷积网络对输入图像进行处理；S2.对map0中的像素点进行阈值化选择；S3.计算出激活像素点所预测文本框的四个顶点坐标；S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon；S5.从集合C中筛选出子集合C1以及子集合C2；S6.通过子集合C1内的激活像素点计算出文本框起始端的两顶点坐标，通过子集合C2内的激活像素点计算出文本框终止端的两顶点坐标；将子集合C1得到的两顶点坐标与子集合C2得到的两顶点坐标进行合并。本发明专利技术的优点在于：可提高EAST算法对长文本的预测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进型EAST算法的文本检测方法
本专利技术涉及一种基于改进型EAST算法的文本检测方法，该方法适用于身份证文字识别、银行卡文字识别、电子票据文字识别、印刷体文档文字识别、自然场景文字识别等OCR文字识别领域。
技术介绍
OCR(OpticalCharacterRecognition)光学字符识别是AI领域的一项重要技术，主要内容是让计算机读取图像中的文字信息。当今主流的OCR技术主要分为两步：1、文本检测，指的是定位出文本在图像中的精确位置；2、文本识别，指的是根据文本检测提供的位置信息将文本裁剪出来并加以识别。现有OCR领域，文本检测技术多如牛毛，性能良好的检测技术主要都是基于深度神经网络，它们的区别仅在于网络的结构和其他的细枝末节。目前比较流行的文本检测技术有CTPN、TextBoxes、EAST、PixelLink等，它们都有各自的优缺点，比如CTPN算法的优点是对水平文本的检测精度高，缺点是无法检测倾斜的文本；EAST文本检测算法虽然可以定位倾斜的文本，但是无法精确定位较长的文本。
技术实现思路
本专利技术的目的在于提供一种基于改进型EAST算法的文本检测方法，解决了原算法对长文本定位准确率低的问题。本专利技术的目的通过如下技术方案实现：一种基于改进型EAST算法的文本检测方法，它包括以下步骤：S1.采用多通道全卷积网络对输入图像进行处理，输出一个9通道特征图，分别为map0，map1，map2，map3，map4，map5，map6，map7，map8；S2.对map0中的像素点进行阈值化选择，将符合阈值范围的像素点选定作为激活像素点；S3.在...

【技术保护点】
1.一种基于改进型EAST算法的文本检测方法，其特征在于，它包括以下步骤：S1.采用多通道全卷积网络对输入图像进行处理，输出一个9通道特征图，分别为map0，map1，map2，map3，map4，map5，map6，map7，map8；S2.对map0中的像素点进行阈值化选择，将符合阈值范围的像素点选定作为激活像素点；S3.在map1‑map8上分别找到激活像素点对应的坐标，并计算出激活像素点所预测文本框的四个顶点坐标；S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon，多边形polygon对应的所有激活像素点组成一个集合C；S5.从集合C中筛选出靠近对应的预测文本框起始端的激活像素点形成子集合C1以及靠近对应的预测文本框终止端的激活像素点形成子集合C2；S6.通过子集合C1内的激活像素点计算出文本框起始端的两顶点坐标，通过子集合C2内的激活像素点计算出文本框终止端的两顶点坐标；将子集合C1得到的两顶点坐标与子集合C2得到的两顶点坐标进行合并，形成最终文本框的四个顶点坐标。

【技术特征摘要】
1.一种基于改进型EAST算法的文本检测方法，其特征在于，它包括以下步骤：S1.采用多通道全卷积网络对输入图像进行处理，输出一个9通道特征图，分别为map0，map1，map2，map3，map4，map5，map6，map7，map8；S2.对map0中的像素点进行阈值化选择，将符合阈值范围的像素点选定作为激活像素点；S3.在map1-map8上分别找到激活像素点对应的坐标，并计算出激活像素点所预测文本框的四个顶点坐标；S4.将各激活像素点预测的文本框根据重合程度进行合并得到多边形polygon，多边形polygon对应的所有激活像素点组成一个集合C；S5.从集合C中筛选出靠近对应的预测文本框起始端的激活像素点形成子集合C1以及靠近对应的预测文本框终止端的激活像素点形成子集合C2；S6.通过子集合C1内的激活像素点计算出文本框起始端的两顶点坐标，通过子集合C2内的激活像素点计算出文本框终止端的两顶点坐标；将子集合C1得到的两顶点坐标与子集合C2得到的两顶点坐标进行合并，形成最终文本框的四个顶点坐标。2.根据权利要求1所述的基于改进型EAST算法的文本检测方法，其特征在于：步骤S4中，计算两激活像素点预测文本框的IoU值，当IoU值大于指定阈值时，将两预测文本框进行合并，并将对应的激活像素点归入集合C内。3.根据权利要求2所述的基于改进型EAST算法的文本检测方法，其特征在于：步骤S4中，IoU指定阈值的取值范围为(0.3，1)。4.根据权利要求1所述的基于改进型EAST算法的文本检测方法，其特征在于：步骤S5中，求集合C中每个激活像素点到其预测文本框起始端两顶点的曼哈顿距离之和dist1与集合C中每个激活像素点到其预测文本框终止端两顶点的曼哈顿距离之和dist2的比值ra...

【专利技术属性】
技术研发人员：史天永，翁增仁，
申请(专利权)人：福建博思软件股份有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人