一种纸币图元素的检测方法技术

技术编号:32857445 阅读:21 留言:0更新日期:2022-03-30 19:30
本发明专利技术涉及纸币检测技术领域,且公开了一种纸币图元素的检测方法,包括以下检测步骤:S1、模型原始输入图像按比例缩放为416

【技术实现步骤摘要】
一种纸币图元素的检测方法


[0001]本专利技术涉及纸币检测
,具体为一种纸币图元素的检测方法。

技术介绍

[0002]针对纸币的检测工作属于小样本目标检测。目前针对纸币的研究工作,资料较少,而小样本目标检测主要基于传统的成熟的目标检测算法。传统图像检测算法主要利用滑动窗口机制进行区域选择,使用图像处理方法提取图片颜色、纹理等中底层特征,结合机器学习分类器实现目标分类。这些传统检测方法直观简单,但是它们的区域选择策略没有针对性,存在大量冗余;特征属性需要人为设定,存在主观误差;检测对象也具有局限性,不具有普适性。2012年之后,基于深度学习的目标检测算法迅速发展。当前主流的目标检测算法主要根据是否有目标候选区域提议步骤分为两类,第一类是以 R

CNN(Region

Convolutional Neural Network)系列为代表的两步目标检测算法。这种方法先利用神经网络学习图像高级的抽象特征,提议生成目标候选区域,再利用神经网络进行回归预测分类这些候选区域是否包含目标对象或包含哪类对象,由于其双阶段的特点,这种方法检测精度高但检测速度较慢,无法满足实时性。第二类是单步目标检测算法。在单步目标检测模型中具有代表性的就是YOLO(You Only Look Once)系列模型,将目标检测问题看作回归问题,采用独立的卷积神经网络模型实现端到端的检测;SSD (Single Shot multibox Detector)模型是YOLO之后又一个引人注目的目标检测结构,在YOLO的基础上借鉴了R

CNN选择候选区域的思路,保证精度的同时兼顾检测速度。
[0003]本文提出检测精度与速度兼具的检测算法,针对纸币图元素检测识别的具体应用场景,采集真实纸币照片图像进行实验,验证了该算法在复杂类别文物背景下的可行性,拓宽了机器视觉的应用领域,为构建AI历史博物馆,建立纸币藏品数据库提供了有力支持。

技术实现思路

[0004](一)技术特点
[0005]本专利技术提供了一种纸币图元素的检测方法,解决现存纸币样本较少,或者现有检测模型检测精度不高、速度较慢的问题,准确识别纸币中印章、角花、花符、主景图等图元素,并设计离散点检测算法去除噪声,对其图像元素进行分类识别并建立相关数据库,可以实现知识共享,进行新纸币的准确检索,相关相似纸币以图搜图任务,并进一步建立相关的图像语义关系,便于博物馆专家研究其间的异同及背后涉及的历史因素,是开创文物研究与数字化结合新范式的重要基础。
[0006](二)技术方案
[0007]为实现上述目的,本专利技术提供如下技术方案:一种纸币图元素的检测方法,包括以下检测步骤:
[0008]S1、模型原始输入图像按比例缩放为416
×
416
×
3,灰色区域用128,128, 128的像素点填充;
[0009]S2、原始纸币图像经过94个卷积层、2个上采样层、3个最大池化层以及各连接层的特征提取工作后,输出第一个尺度为52
×
52
×
27,即52
×
52
×ꢀ3×
(4+1+类别数)的大尺度特征图张量,即将416
×
416
×
3的原始输入图像划分为52
×
52
×
3个候选区域,此张量用于这些大尺度候选框的预测回归;
[0010]S3、输出每个尺度张量的同时,将卷积得到的特征图与主干网络中提取到的最后三层特征图相应进行张量连接;
[0011]S4、输出大尺度张量的过程中,第136层输出52
×
52
×
128的特征图下采样和第126层得到的26
×
26
×
256的特征图进行特征拼接,再经7个卷积层处理输出26
×
26
×
27的中尺度张量,负责预测回归26
×
26
×
3个中尺度候选框的位置和类别;
[0012]S5、输出中尺度张量的过程中,第147层输出26
×
26
×
256的特征图下采样和第116层得到的13
×
13
×
512的特征图进行特征拼接,再经7个卷积层处理输出13
×
13
×
21的小尺度张量,负责预测回归13
×
13
×
3个小尺度候选框的位置和类别;
[0013]S6、根据已标注的纸币数据真实目标框的信息,通过K

means算法聚类生成9种尺寸的先验框,根据感受野的大小均分给三个尺度的特征图;
[0014]S7、网络不断学习,输出10647个候选框的预测结果,即x轴、y轴坐标的偏移量t
x
、t
y
,宽高的缩放尺度t
w
、t
h
,以及置信度系数t
o

[0015]S8、根据公式一转换为边界框中心点相对于整体特征图的坐标信息和边界框宽高信息,其中C
x
、C
y
是栅格左上角坐标,p
w
、p
h
是预设的先验框映射到特征坐标系中的宽和高,表示使用sigmoid函数激活,对置信度系数使用 sigmoid函数可以抑制最大类别概率对其他类别概率的影响;
[0016]S9、之后采用逻辑回归微调锚框位置并对每个锚框包含的内容进行边界框打分,通过边界框打分和DIoU_nms方法去除大多数多余的框减少计算量,以此计算Loss;
[0017]S10、网络模型的损失函数由CIoU_Loss、置信度损失、分类损失共同计算得到,置信度损失和分类损失与YOLO v3损失函数中保持一致,CIoU_Loss 计算公式为
[0018]S11、对检测结果再次使用聚类方法,在预测框内随机打点,找到各元素的大致位置;
[0019]S12、通过异常点检测和剔除,消除由纸币边框元素或污渍造成的误检错检。以此得到准确的图元素定位结果。
[0020]优选的,所述IOU表示预测框和真实框的交并比,Distance_22表示两框中心点之间的欧式距离,Distance_C2表示两框最小外接矩形的对角线距离,v表示衡量长宽比一致的参数。
[0021]优选的,所述v的公式为
[0022]优选的,所述公式一为
[0023]优选的,所述检测方法由多层卷积网络组成,实现多尺度目标测量。
[0024]优选的,所述检测方法实现3个尺度上纸币图像的预测回归。
[0025](三)有益效果
[0026]本专利技术提供了一种纸币图元素的检测方法,具备以下有益效果:
[0027](1)、本专利技术检测方法对纸币上具有代表性的五类图元素进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种纸币图元素的检测方法,其特征在于,包括以下检测步骤:S1、模型原始输入图像按比例缩放为416
×
416
×
3,灰色区域用128,128,128的像素点填充;S2、原始纸币图像经过94个卷积层、2个上采样层、3个最大池化层以及各连接层的特征提取工作后,输出第一个尺度为52
×
52
×
27,即52
×
52
×3×
(4+1+类别数)的大尺度特征图张量,即将416
×
416
×
3的原始输入图像划分为52
×
52
×
3个候选区域,此张量用于这些大尺度候选框的预测回归;S3、输出每个尺度张量的同时,将卷积得到的特征图与主干网络中提取到的最后三层特征图相应进行张量连接;S4、输出大尺度张量的过程中,第136层输出52
×
52
×
128的特征图下采样和第126层得到的26
×
26
×
256的特征图进行特征拼接,再经7个卷积层处理输出26
×
26
×
27的中尺度张量,负责预测回归26
×
26
×
3个中尺度候选框的位置和类别,检测方法实现3个尺度上纸币图像的预测回归;S5、输出中尺度张量的过程中,第147层输出26
×
26
×
256的特征图下采样和第116层得到的13
×
13
×
512的特征图进行特征拼接,再经7个卷积层处理输出13
×
13
×
21的小尺度张量,负责预测回归13
×
13
×
3个小尺度候选框的位置和类别;S6、根据已标注的纸币数据真实目标框的信息,通过K

...

【专利技术属性】
技术研发人员:王笑梅王晨
申请(专利权)人:上海师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1