一种基于Resnet和Transformer的手写签名检测方法技术

技术编号:37064452 阅读:18 留言:0更新日期:2023-03-29 19:42
本发明专利技术提供了计算机视觉技术领域的一种基于Resnet和Transformer的手写签名检测方法,包括如下步骤:步骤S10、基于Transformer构建Backbone,基于RepB l ock构建Neck,基于解耦检测头构建Head;步骤S20、基于所述Backbone、Neck以及Head构建签名检测模型;步骤S30、获取大量的手写签名照片,利用各所述手写签名照片对签名检测模型进行训练;步骤S40、利用训练后的所述签名检测模型进行手写签名检测。本发明专利技术的优点在于:极大的提升了手写签名检测的准确率以及速度。名检测的准确率以及速度。名检测的准确率以及速度。

【技术实现步骤摘要】
一种基于Resnet和Transformer的手写签名检测方法


[0001]本专利技术涉及计算机视觉
,特别指一种基于Resnet和Transformer的手写签名检测方法。

技术介绍

[0002]手写签名用于识别签名人身份并表明签名人认可文件的内容,其具备法律效力;随着电子化办公的盛行,产生了检测手写签名的需求。针对手写签名的检测,目前主要采用由Backbone、Neck和Head构建的检测模型进行检测,Backbone采用Resnet

50作为骨干网络,用于提取图片中的特征,Neck用于收集骨干网络提取的不同特征并做处理以增强模型效果,Head即检测头,用于预测目标的类别和在图片中的位置。
[0003]然而,Resnet

50虽然具有强大的视觉表示学习能力,其局部信息建模的结构能够充分使用空间局部性和平移等边性,但由于只能对局部信息建模,缺少长距离建模和感知的能力,导致手写签名检测的准确率和速度欠佳。
[0004]因此,如何提供一种基于Resnet和Transformer的手写签名检测方法,实现提升手写签名检测的准确率以及速度,成为一个亟待解决的技术问题。

技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种基于Resnet和Transformer的手写签名检测方法,实现提升手写签名检测的准确率以及速度。
[0006]本专利技术是这样实现的:一种基于Resnet和Transformer的手写签名检测方法,包括如下步骤:
[0007]步骤S10、基于Transformer构建Backbone,基于RepBlock构建Neck,基于解耦检测头构建Head;
[0008]步骤S20、基于所述Backbone、Neck以及Head构建签名检测模型;
[0009]步骤S30、获取大量的手写签名照片,利用各所述手写签名照片对签名检测模型进行训练;
[0010]步骤S40、利用训练后的所述签名检测模型进行手写签名检测。
[0011]进一步地,所述步骤S10中,所述Backbone的构建过程如下:
[0012]使用Transformer的CoT模块替换Resnet

50网络中的各3
×
3卷积,得到CoTnet

50网络,基于所述CoTnet

50网络构建Backbone。
[0013]进一步地,所述步骤S10中,所述Neck的构建过程如下:
[0014]使用RepBlock替换CSP

Block进而构建Neck;
[0015]所述RepBlock包含RepVGGBlock,利用3
×
3卷积替代训练阶段的所述RepVGGBlock。
[0016]进一步地,所述步骤S10中,所述Head的构建过程如下:
[0017]基于Hybrid Channels策略生成的解耦检测头构建Head。
[0018]进一步地,所述步骤S20中,所述签名检测模型的损失函数如下:
[0019]L
loss
=L
cls
+L
reg

[0020]L
cls


ω
pos
×
ln(s)

ω
neg
×
ln(1

s);
[0021]L
reg
=ω
pos
×
CIoU(b
gt
,b
pre
);
[0022]其中,L
loss
表示签名检测模型的损失函数;ω
pos
表示正样本的分配权重;ω
neg
表示负样本的分配权重;s表示预测的类别得分;b
gt
表示真实的bbox;b
pre
表示预测的bbox;CIoU()表示Complete

IoU Loss函数。
[0023]本专利技术的优点在于:
[0024]通过将Transformer的CoT模块移植到Resnet

50网络中,作为整个签名检测模型的Backbone,通过CoT模块将上下文的挖掘与自注意力的学习集成到统一的框架中,充分探索邻近的上下文信息,以一种高效的方式提升自注意力的学习,进而提升Backbone输出特征的表达能力;通过RepBlock替换Neck中常用的CSP

Block,使得签名检测模型能保持较好的多尺度特征融合能力,在硬件上能进行高效推理,且利用3
×
3卷积替代训练阶段的RepVGGBlock,进一步提升签名检测模型的推理速度;通过将损失函数中的IoU Loss替换为Complete

IoU Loss,充分考虑预测框和目标框的重叠面积、中心点距离、长宽比这几个几何因素,使得签名检测模型收敛的精度更高,最终极大的提升了手写签名检测的准确率以及速度。
附图说明
[0025]下面参照附图结合实施例对本专利技术作进一步的说明。
[0026]图1是本专利技术一种基于Resnet和Transformer的手写签名检测方法的流程图。
[0027]图2是本专利技术CoT模块的网络结构图。
[0028]图3是本专利技术Neck的网络结构图。
[0029]图4是本专利技术RepBlock的网络结构图。
[0030]图5是本专利技术RepVGGBlock的网络结构图。
[0031]图6是本专利技术RepVGGBlock的结构重新参数化的示意图。
[0032]图7是本专利技术Head的网络结构图。
具体实施方式
[0033]请参照图1至图7所示,本专利技术一种基于Resnet和Transformer的手写签名检测方法的较佳实施例,包括如下步骤:
[0034]步骤S10、基于Transformer构建Backbone,基于RepBlock构建Neck,基于解耦检测头构建Head;
[0035]步骤S20、基于所述Backbone、Neck以及Head构建签名检测模型;
[0036]步骤S30、获取大量的手写签名照片,利用各所述手写签名照片对签名检测模型进行训练;
[0037]步骤S40、利用训练后的所述签名检测模型进行手写签名检测。
[0038]所述步骤S10中,所述Backbone的构建过程如下:
[0039]使用Transformer的CoT模块替换Resnet

50网络中的各3
×
3卷积,得到CoTnet

50
网络,基于所述CoTnet

50网络构建Backbone。Transforme本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Resnet和Transformer的手写签名检测方法,其特征在于:包括如下步骤:步骤S10、基于Transformer构建Backbone,基于RepBlock构建Neck,基于解耦检测头构建Head;步骤S20、基于所述Backbone、Neck以及Head构建签名检测模型;步骤S30、获取大量的手写签名照片,利用各所述手写签名照片对签名检测模型进行训练;步骤S40、利用训练后的所述签名检测模型进行手写签名检测。2.如权利要求1所述的一种基于Resnet和Transformer的手写签名检测方法,其特征在于:所述步骤S10中,所述Backbone的构建过程如下:使用Transformer的CoT模块替换Resnet

50网络中的各3
×
3卷积,得到CoTnet

50网络,基于所述CoTnet

50网络构建Backbone。3.如权利要求1所述的一种基于Resnet和Transformer的手写签名检测方法,其特征在于:所述步骤S10中,所述Neck的构建过程如下:使用RepBlock替换CSP

Block进而构建Neck;所述RepBlock包含RepVGGBlock,利用3
×
3卷积替代训练阶段的所述RepVGGBlock。4.如权利要求1所述的一种基于Resnet和Tran...

【专利技术属性】
技术研发人员:张西王雷赵庆勇林克
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1