一种基于改进EAST算法的栅格地质图文本检测方法技术

技术编号:27031943 阅读:29 留言:0更新日期:2021-01-12 11:15
本发明专利技术公开了一种基于改进EAST算法的栅格地质图文本检测方法,该方法采用多尺度对象分割算法进行图像背景和图像文本的分割,同时结合按比例尺方法切割训练样本,然后运用focal‑loss函数改进模型损失函数,最后采用难、易检测文本目标权重动态调整策略来改进文本目标漏检的问题。实验验证了该算法具有检测准确率较高、对不同的地质图像的适应力较强的优点。能够有效降低地质图像文本检测的漏检率,具有一定的工程应用价值。实验结果表明,对多比例尺栅格地质图像进行文本检测,采用改进后EAST算法准确率相对改进前提高了5.1%,可更加快速、准确的检索到相关地质图像文字。

【技术实现步骤摘要】
一种基于改进EAST算法的栅格地质图文本检测方法
本专利技术涉及栅格地质图像的处理技术,具体是一种基于改进EAST算法的地质图像文本检测方法。
技术介绍
我国历史上形成的百万档级海量栅格地质图像包括了大量的地理、地质信息,对矿床发现、石油勘探、储量估计、地理坐标定位等有着重大意义。栅格地质图像中的信息呈现形式以文本字符为主,因此栅格地质图像中的文本识别、定位研究就显得尤为重要。随着深度学习技术的不断发展,地质领域存在的大量栅格图像数据亟待通过新技术来进行处理。面对历史上如此海量的地质图像,传统的人工处理方式已经满足不了检索需要。文本检测算法通过计算机自动框定出文本在地质图像中的范围,作为后续文本识别过程的先行条件,在地质图像的检索和信息提取中起着举足轻重的作用。传统的文本检测方法和一些基于深度神经网络的文本定位方法,主要由若干阶段和组件构成,在训练时需要对多个步骤进行调优,耗费时间较多。所以这些方法的准确率和效率仍然不能达到工业级别的应用。
技术实现思路
针对现有文本检测算法对地质图像中的文本符号检测准确率不够高,不同比例尺的图像检测差异大,文本尺度多样化的问题,本专利技术提供了一种基于改进EAST算法的地质图像文本检测方法,该方法运用多尺度的方法进行图像背景和图像文本的分割,然后按不同比例尺切割图像训练样本,通过减少易提取样本的权重策略改进损失函数解决文本框漏检的问题,使得算法在地质图像上的检测效果更好。实现本专利技术目的的技术方案是:一种基于改进EAST算法的栅格地质图文本检测方法,包括:(1)提取地质图像的文本区域,对图像背景和图像文字的像素点进行分割训练,公式如下:(1)对于四边形的每条边,使其每个顶点分别缩进和,其中N是一个超参数,针对不同比例尺的图像,根据地质图像的比例尺将N(0.0~1.0)设置为不同的值,优化检测结果;(2)按比例尺切割训练样本,在训练过程中,采用多尺度的训练方法,对于比例尺为1︰N,大小为M*M的的地质图像,在训练阶段为每张图像设置的尺度为X*X*X,其中X=[M/N];每张图像选择对应比例尺的尺度组成多尺度图像训练集;(3)引入Focal-loss损失函数作为分类损失函数用来表示图像分割预测值和真实值的相似度,公式如下:(2)式中:;利用动态调整权重的策略对文本区域损失进行改进,使中的权重对不同比例尺的地质图像中的各个尺度的文字保持一致;对于一张比例尺为1:N的地质图像,同一批次训练样本中的文本区域都包含相同的权重,图像中的像素点i应该满足公式(3):(3)其中表示图像中总像素的个数,表示文本区域中实际的文字像素的个数;当图像样本中的数量增加时,损失的权值会受到抑制;当图像样本中的数量减少时,尺度较小的文本区域权值会变大,尺度较大的文本区域权值会相应变小,权重会相对一致,改进后的回归损失如公式(4)所示:(4)式中:为将文本框中面积大于或小于某个阈值的框设置为困难样本;(4)在局部感知NMS的基础上,利用倾斜的NMS处理地质图像数据集中的倾斜文本,其步骤如下:1)对网络输出的旋转矩形文本检测框按照得分进行降序排列,并存储到一个降序列表里;2)依次遍历上述的降序列表,将当前的文本框和剩余的其它文本框进行交集计算的到相应的相交点集合;3)根据判断相交点集合组成的凸多边形的面积,计算每两个文本检测框的IOU;对于大于阈值的文本框进行过滤,保留小于阈值的文本框;4)得到最终的文本矩形检测框。本专利技术的有益效果是:本专利技术采用多尺度对象分割算法进行图像背景和图像文本的分割,同时结合按比例尺方法切割训练样本,然后运用focal-loss函数改进模型损失函数,最后采用难、易检测文本目标权重动态调整策略来改进文本目标漏检的问题。实验验证了文中提出的算法具有检测准确率较高、对不同的地质图像的适应力较强的优点。能够有效降低地质图像文本检测的漏检率,具有一定的工程应用价值。实验结果表明,对多比例尺栅格地质图像进行文本检测,采用改进后EAST算法准确率相对改进前提高了5.1%,可更加快速、准确的检索到相关地质图像文字。附图说明图1为本专利技术实施例中EAST算法网络结构图;图2为本专利技术实施例中重叠区域面积计算过程示意图;图3为本专利技术实施例中背景文字相对分离示意图;图4为本专利技术实施例中背景和文字交叉示意图;图5为本专利技术实施例中Focal-loss与交叉熵损失函数对比示意图;图6为本专利技术实施例中实际的复杂地质图像中文本检测效果对比示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的阐述。实施例:基于改进EAST算法的地质图像文本检测方法,包括:1、EAST算法EAST算法主要包含三个部分:EAST算法神经网络结构、基于平衡的交叉熵损失函数、局部感知非极大值抑制网络(NMS)。其中:(1)EAST算法神经网络结构EAST算法的神经网络结构如图1所示,由图1可知该网络结构分为特征提取器主干、特征合并分支和输出层三个部分。特征提取器主干从ImageNet数据集上预训练的卷积网络中选取四组卷积层Conv1、Conv2、Conv3、Conv4。分别从中提取四个级别的特征图,表示为f1、f2、f3、f4。其图像大小分别为输入图像的1/32、1/16、1/8、1/4。在特征合并分支中,逐层合并生成的四组特征图;(1)(2)其中是合并基础,是合并的特征图,运算符[:;:]表示沿通道轴的合并。在每个合并阶段,来自最后一个阶段的特征图首先被输入到反池化层(unpool)中以使其大小加倍,然后与当前特征图合并。通过conv1×1的卷积层减少通道的数量并且减少计算量,接着是一个conv3×3的卷积层,它融合了局部信息产生这个合并阶段的输出。在最后一个合并阶段之后,使用conv3×3卷积核合并所有的特征图并将其输入到输出层。输出层分为三个部分:置信度、文本区域和文本区域旋转角度、包含8个坐标的矩形文本区域。最终的输出结果是1x1的卷积提取特征。(2)基于平衡的交叉熵损失函数原算法的损失函数可以表示为:(3)其中,表示分割图像背景和图像文本的分类损失,文本区域所在的部分表示1,非文本区域的背景部分表示0,即像素点的分类损失。表示对应文本区域的像素点所组成的矩形框和矩形框角度的回归损失。表示两个损失之间的相关性。为了简化训练过程,分类损失使用平衡的交叉熵,在原EAST算法中将设置为1,公式如下:(4)其中表示置信度的预测值,表示置信度的真实值,参数是正样本和负样本之间的平衡因子。其计算公式如下所示:(5)几何图损失又分为两部分,一部分是IOU损失,一部分为旋转角度损失:(6)(7)其中,是文本区域旋转角度的预测值,而表示文本本文档来自技高网...

【技术保护点】
1.一种基于改进EAST算法的栅格地质图文本检测方法,其特征是:包括:/n(1)提取地质图像的文本区域,对图像背景和图像文字的像素点进行分割训练,公式如下:/n

【技术特征摘要】
1.一种基于改进EAST算法的栅格地质图文本检测方法,其特征是:包括:
(1)提取地质图像的文本区域,对图像背景和图像文字的像素点进行分割训练,公式如下:

(1)
对于四边形的每条边,使其每个顶点分别缩进和,其中N是一个超参数,针对不同比例尺的图像,根据地质图像的比例尺将N(0.0~1.0)设置为不同的值,优化检测结果;
(2)按比例尺切割训练样本,在训练过程中,采用多尺度的训练方法,对于比例尺为1︰N,大小为M*M的的地质图像,在训练阶段为每张图像设置的尺度为X*X*X,其中X=[M/N];每张图像选择对应比例尺的尺度组成多尺度图像训练集;
(3)引入Focal-loss损失函数作为分类损失函数用来表示图像分割预测值和真实值的相似度,公式如下:

(2)
式中:;
利用动态调整权重的策略对文本区域损失进行改进,使中的权重对不同比例尺的地质图像中的各个尺度的文字保持一致;对于一张比例尺为1:N的地质图像,同一批次训练样本中...

【专利技术属性】
技术研发人员:王茂发韩定良高光大王子民潘明华
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1