一种DRRG算法优化方法技术

技术编号:29403716 阅读:25 留言:0更新日期:2021-07-23 22:41
本发明专利技术属于自然场景文本检测算法技术领域,特别涉及一种DRRG算法优化方法,步骤1:图像预处理;步骤2:输入特征提取网络进行特征提取;步骤3:特征融合;步骤4:FFM特征融合;步骤5:输入BLSTM网络;步骤6:输入Text‑GCN深度关系推理网络;步骤7:输出结果。通过FFM特征融合模块先将步骤3中输出的底层大感受野特征融合结果与中层中感受野特征融合结果进行特征融合,进一步再与顶层小感受野特征融合输出结果融合,解决DRRG算法对小感受野文本关注不够,大感受野特征图在融合过程中比例逐渐减小,不利于后续处理等问题。DRRG算法预测误差大大减小,召回率及精确率大大提升。

【技术实现步骤摘要】
一种DRRG算法优化方法
本专利技术属于自然场景文本检测算法
,特别涉及一种DRRG算法优化方法。
技术介绍
传统的文本检测方法和一些基于深度学习的文本检测方法,大多针对的是长文本以及规则形状的文本,但对于任意形状文本以及弯曲文本检测效果并不好,精确度也存在局限。针对上述存在的问题,2020年提出了DRRG(DeepRelationalReasoningGraphNetworkforArbitraryShapeTextDetection)算法,它是2020年CVPR新提出的两个文本检测算法之一,由北京科技大学、中国科学技术大学人工智能联合实验室、和腾讯科技联合推出,运用深度关系推理图网络进而用于任意形状文本检测。局部图(localgraph)建立起了基于CNN的textproposal模型和基于GCN(GraphConvolutionalNetwork)的深度关系推理网络之间的关系,使模型可以达到端到端训练。DRRG采用了类似EAST算法的FCN结构,融合5层特征,并针对EAST算法中对于序列特征的缺失,采用GCN方法,实现了新的链接方式本文档来自技高网...

【技术保护点】
1.一种DRRG算法优化方法,其特征在于,包括以下步骤:/n步骤1:训练集预处理;/n步骤2:将处理过的训练集图片输入主网络由VGG16替换为ResNet50的特征提取网络进行特征提取;/n步骤201:提取5层特征图,依次记为f

【技术特征摘要】
1.一种DRRG算法优化方法,其特征在于,包括以下步骤:
步骤1:训练集预处理;
步骤2:将处理过的训练集图片输入主网络由VGG16替换为ResNet50的特征提取网络进行特征提取;
步骤201:提取5层特征图,依次记为f5、f4、f3、f2、f1;
步骤3:特征融合;
步骤301:f1特征图经过反卷积操作通道数变为原来的1/2,特征图大小扩大一倍,记为h0。与f2进行特征融合,送入Upblock模块,进行卷积收集空间和通道信息,输出记为h1;
步骤302:f3和h1融合,融合后送入Upblock模块,进行卷积收集空间和通道信息,记为h2;
步骤303:f4和h2融合,融合后送入Upblock模块,进行卷积收集空间和通道信息,记为h3;
步骤304:f5和h3融合,融合后送入Upblock模块,进行卷积收集空间和通道信息,记为h4;
步骤4:FFM特征融合;
步骤401:将h0和h2送入FFM特征融合模块,输出结果记为h5;
步骤402:将h4和h5送入FFM特征融合模块,输出结果记为h6;
步骤5:输入BLSTM网络;
步骤501:将FFM特征融合结果h6输入BLSTM网络;
步骤6:输入Text-GCN深度关系推理网络;
步骤601:将BLSTM网络的输出结果经过处理送入Text-GCN深度关系推理网络,进行节点间关系推理,将输出结果作为最后结果输出。


2.根据权利要求1所述的一种DRRG算法优化方法,其特征在于,所述步骤201中,利用优化后的特征提取网络ResNet50,提取出五层特征图依次记为f5、f4、f3、f2、f1,特征图大小依次减小,为上一特征图的1/2,通道数依次为:64、128、256、512、512。


3.根据权利要求1所述的一种DRRG算法优化方法,其特征在于,所述步骤301中,f1特征图经过反卷积操作通道数变为原来的1/2,特征图大小扩大一倍,记为h0,此时特征图通道数为256,特征图大小为原图片的1/16,采用通道融合方式与f2进行特征融合,送入Upbl...

【专利技术属性】
技术研发人员:张开玉卢玉莹
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1