当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于全变分降噪的掩膜生成方法技术

技术编号:39843090 阅读:8 留言:0更新日期:2023-12-29 16:34
本发明专利技术公开了一种基于全变分降噪的掩膜生成方法,属于图像处理领域,该方法包括利用网络爬虫爬取原始图像以及对原始图像进行修改得到的篡改图像,得到原始数据;丢弃与原始图像像素大小不同的篡改图像,并将原始图像与相应的篡改图像相减,得到相减图像数据集;根据相减图像数据集,利用最大稳定极值区域法和非极大值抑制法,得到若干个相减图像的文字信息;对相减图像数据集中的相减图像进行全变分降噪处理,得到处理图像数据集;将处理图像数据集中的处理图像和对应的相减图像的文字信息叠加,得到掩膜

【技术实现步骤摘要】
一种基于全变分降噪的掩膜生成方法


[0001]本专利技术属于图像处理领域,尤其涉及一种基于全变分降噪的掩膜生成方法


技术介绍

[0002]不论是文化

经济还是社会生活中都急需能便捷识别出这些篡改图片的工具

目前有很多深度学习模型正在致力于解决这个问题,但是它们也面临着很大的困难

一个深度学习模型的识别效果的好坏,很大程度上取决于它在训练过程中使用的数据集的好坏

目前已有的数据集或多或少都存在一些问题:
Defacto
数据集是人工合成的,存在不完全符合真实篡改情况的问题
。CASIA v1.0
数据集中收集的篡改图片都是由很少种类的篡改方式编辑的,不能代表多样的篡改图片
。NIST 2016
数据集比较全面但是它是美国国家标准与技术研究院私有的
。COVERAGE
数据集样本量很小,不能让深度学习模型有很深度的学习
。CASIA v2.0
数据集存在主题分布不平衡和受限

图像质量和元数据以及潜在的过拟合等问题

这些问题可能让学习这个数据集的模型不能有泛化性

[0003]现有的一种技术方案是数据标注,数据标注是大部分人工智能算法得以有效运行的关键环节

人工智能算法是数据驱动型算法,也就是说,如果想实现人工智能,首先需要把人类理解和判断事物的能力教给计算机,让计算机学习到这种识别能力

[0004]数据标注的过程是通过人工贴标的方式,为机器系统可供学习的样本

数据标注是把需要机器识别和分辨的数据贴上标签,然后让计算机不断地学习这些数据的特征,最终实现计算机能够自主识别

[0005]图像标注的质量标准:图像标注的质量好坏取决于像素点的判定准确性

标注像素点越接近被标注物的边缘像素,标注的质量就越高,标注的难度也越大

如果图像标注要求的准确率为
100
%,标注像素点与被标注物的边缘像素点的误差应该在1个像素以内

[0006]图像数据的标注流程为:
[0007](1)
数据清洗:排除数据存在缺失值

噪声数据

重复数据等质量问题

[0008](2)
数据标注:划分标注任务

制定标注规范

进行标注任务

[0009](3)
标注检验:由标注审核员或机器质检机制,审核标注质量

技术实现思路

[0010]针对现有技术中的上述不足,本专利技术提供的一种基于全变分降噪的掩膜生成方法解决了掩膜获取效率低且质量不够的问题

[0011]为了达到上述专利技术目的,本专利技术采用的技术方案为:一种基于全变分降噪的掩膜生成方法,包括以下步骤:
[0012]S1、
利用网络爬虫爬取原始图像以及对原始图像进行修改得到的篡改图像,得到原始数据;
[0013]S2、
丢弃与原始图像像素大小不同的篡改图像,并将原始图像与相应的篡改图像相减,得到相减图像数据集;
[0014]S3、
根据相减图像数据集,利用最大稳定极值区域法和非极大值抑制法,得到若干个相减图像的文字信息;
[0015]S4、
对相减图像数据集中的相减图像进行全变分降噪处理,得到处理图像数据集;
[0016]S5、
将处理图像数据集中的处理图像和对应的相减图像的文字信息叠加,得到掩膜

[0017]本专利技术的有益效果为:本专利技术可以在处理器上自动运行,减小了人工成本,提高了掩膜获取效率;通过利用最大稳定极值区域法和非极大值抑制法,实现图像的文字信息获取,将图像背景和图像文字信息分割,避免图像文字信息丢失,提高了掩膜的质量;并且通过全变分降噪,能够提高掩膜的质量,降低图像噪声;利用网络爬虫爬取原始图像以及对原始图像进行修改得到的篡改图像,增加了篡改图像的样本多样性

[0018]进一步地,所述步骤
S1
中原始数据中的每一张原始图像均有若干张对应的篡改图像

[0019]上述进一步方案的有益效果为:将获取的多种类型的篡改图像与其原始图像一一对应,便于后续的图像处理

[0020]进一步地,所述步骤
S2
中相减图像数据集的表达式为:
[0021]U

[A
0,xp
,A
1,xp
,

,A
i,xp
,

,A
n,xp
][0022]A
i,xp

A
i,0

B
i,r

i

1,...,n
[0023]其中,
U
为相减图像数据集;
A
i,xp
为第
i
个原始图像对应的相减图像集合;
A
n,xp
为第
n
个原始图像对应的相减图像集合;
A
i,0
为第
i
个原始图像;
B
i,r
为第
i
个原始图像所对应的第
r
个篡改图像;
i
为原始图像编号;
n
为原始图像总数;
r
为篡改图像编号

[0024]上述进一步方案的有益效果为:丢弃掉无法使用的图像,提高图像处理效率,同时,对每一个图像进行有序的编号,便于后续图像处理

[0025]进一步地,所述步骤
S3
具体为:
[0026]S301、
获取相减图像数据集中各相减图像的灰度图像;
[0027]S302、
对各相减图像的灰度图像进行二值化处理,得到各灰度阈值的二值图;
[0028]S303、
分别计算各灰度阈值的二值图中的连通区域的变化率:
[0029][0030]其中,
v(t)
为灰度阈值为
t
的二值图中的连通区域的变化率;
Q
t+
Δ
为灰度阈值为
t+
Δ
的二值图中的连通区域;
Q
t

Δ
为灰度阈值为
t

Δ
的二值图中的连通区域;
Q
t
为灰度阈值为
t
的二值图中的连通区域;
Δ
为灰度阈值微小增量;
|...

【技术保护点】

【技术特征摘要】
1.
一种基于全变分降噪的掩膜生成方法,其特征在于,包括以下步骤:
S1、
利用网络爬虫爬取原始图像以及对原始图像进行修改得到的篡改图像,得到原始数据;
S2、
丢弃与原始图像像素大小不同的篡改图像,并将原始图像与相应的篡改图像相减,得到相减图像数据集;
S3、
根据相减图像数据集,利用最大稳定极值区域法和非极大值抑制法,得到若干个相减图像的文字信息;
S4、
对相减图像数据集中的相减图像进行全变分降噪处理,得到处理图像数据集;
S5、
将处理图像数据集中的处理图像和对应的相减图像的文字信息叠加,得到掩膜
。2.
根据权利要求1所述基于全变分降噪的掩膜生成方法,其特征在于,所述步骤
S1
中原始数据中的每一张原始图像均有若干张对应的篡改图像
。3.
根据权利要求1所述基于全变分降噪的掩膜生成方法,其特征在于,所述步骤
S2
中相减图像数据集的表达式为:
U

[A
0,xp
,A
1,xp
,

,A
i,xp
,

,A
n,xp
]A
i,xp

A
i,0

B
i,r

i

1,...,n
其中,
U
为相减图像数据集;
A
i,xp
为第
i
个原始图像对应的相减图像集合;
A
n,xp
为第
n
个原始图像对应的相减图像集合;
A
i,0
为第
i
个原始图像;
B
i,r
为第
i
个原始图像所对应的第
r
个篡改图像;
i
为原始图像编号;
n
为原始图像总数;
r
为篡改图像编号
。4.
根据权利要求1所述基于全变分降噪的掩膜生成方法,其特征在于,所述步骤
S3
具体为:
S301、
获取相减图像数据集中各相减图像的灰度图像;
S302、
对各相减图像的灰度图像进行二值化处理,得到各灰度阈值的二值图;
S303、
分别计算各灰度阈值的二值图中的连通区域的变化率:其中,
v(t)
为灰度阈值为
t
的二值图中的连通区域的变化率;
Q
t+
Δ
为灰度阈值为
t+
Δ
的二值图中的连通区域;
Q
t

Δ
为灰度阈值为
t

Δ
的二值图中的连通区域;
Q
t
为灰度阈值为
t
的二值图中的连通区域;
Δ
为灰度阈值微小增量;

【专利技术属性】
技术研发人员:周吉喆杨欣宇张健陈相羽冯文韬
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1