面向文本高清标准化的图像数据压缩方法及系统技术方案

技术编号:39324862 阅读:9 留言:0更新日期:2023-11-12 16:03
本发明专利技术公开一种面向文本高清标准化的图像数据压缩方法及系统,包括:对档案图像进行优化获得高清图像,将对应的原始档案图像和高清图像组合行成原始高清图像对;对原始高清图像对数据集进行文本质量评估;根据文本质量评估结果,构建图像标准化约束公式,对原始高清图像对数据集进行数据清洗,最终得到高清标准化图像对数据集;构建文本图像高清与数据压缩优化生成网络,并对构建的网络进行训练;基于训练后文本图像高清与数据压缩优化生成网络对高清标准化图像对数据集进行处理,得到图像数据压缩处理结果。本发明专利技术针对档案图像采用Transformer网络框架与超先验技术的结合,能够在保证图像质量的前提下,有效实现图像数据的压缩。的压缩。的压缩。

【技术实现步骤摘要】
面向文本高清标准化的图像数据压缩方法及系统


[0001]本专利技术涉及图像处理
,尤其涉及一种面向文本高清标准化的图像数据压缩方法及系统。

技术介绍

[0002]数字化档案进程中需要通过调整图像文本模糊度和灰度,使扫描的原始档案图像优化为符合质量要求的高清标准化图像。同时,为了节省硬件存储资源和提高数字化文本图像的传输速度,需要对图像进行必要的压缩处理。然而,如何有效实现在档案图像高清标准化及图像数据压缩联合任务是一个关键挑战。
[0003]在图像高清技术中,降噪技术在一定程度上可以减少图像中的噪声,提高图像的清晰度。但是,过度的降噪会导致图像细节的丢失和模糊,影响图像的质量。在数据压缩技术中,JPEG等技术关注于如何提高压缩比,对图像噪声和失真的容忍度较低。且现有的图像高清和数据压缩方法,往往实现单个任务,很难根据原始图像信息分布、针对性地进行数据压缩且保证图像文本灰度和模糊度的质量标准约束。

技术实现思路

[0004]本专利技术针对现有的图像高清和数据压缩方法,往往实现单个任务,很难根据原始图像信息分布、针对性地进行数据压缩且保证图像文本灰度和模糊度的质量标准约束的问题,提出了一种面向文本高清标准化的图像数据压缩方法及系统,该方法主要包含两部分:文本图像高清标准化评估方法与文本图像高清与数据压缩优化生成网络。该方法针对档案图像,采用了Transformer网络框架与超先验技术的结合,能够在保证图像质量的前提下,有效实现图像数据的压缩。针对档案数字化进程中人工图像质量评估的不确定性,本专利提出一种文本图像高清标准化评估方法,其中包含字符灰度与模糊度质量指标评估,据此构建高清标准化数据集。针对文本图像高清标准化任务和图像数据压缩任务之间的一个协同优化挑战,本专利提出了一种文本图像高清与数据压缩优化生成网络。基于Transformer网络框架进行编解码,使用多个自注意力层和前馈神经网络层来对图像进行特征提取。基于超先验模块进行超编解码,超编码的核心思想是利用神经网络将图像编码为一组超先验分布参数和残差信息。在超解码过程中,超先验分布参数被用于重建共性信息,更好地捕捉图像中的结构和纹理信息,从而实现更高的重建质量和更高的压缩率。针对文本图像高清与数据压缩优化生成网络,本专利提出了一种任务均衡的损失函数。该函数对图像高清损失函数与数据压缩损失函数进行加权,使得训练网络完成目标任务。针对网络的输出结果,本专利提出了一种用于联合评判文本图像高清标准化与数据压缩程度的指标,用于评估文本图像高清和图像数据压缩任务的效果。
[0005]为了实现上述目的,本专利技术采用以下技术方案:
[0006]本专利技术一方面提出一种面向文本高清标准化的图像数据压缩方法,包括:
[0007]步骤1:生成档案图像;
[0008]步骤2:对档案图像进行优化获得高清图像,将对应的原始档案图像和高清图像组合行成原始高清图像对,进而得到原始高清图像对数据集;
[0009]步骤3:对原始高清图像对数据集进行文本质量评估;包括图像字符灰度值评估和图像模糊度评估;
[0010]步骤4:根据文本质量评估结果,构建图像标准化约束公式,对原始高清图像对数据集进行数据清洗,最终得到高清标准化图像对数据集;
[0011]步骤5:构建文本图像高清与数据压缩优化生成网络,并对构建的网络进行训练;所述网络包括编码器、超编码器、超解码器、解码器;
[0012]步骤6:基于训练后文本图像高清与数据压缩优化生成网络对高清标准化图像对数据集进行处理,得到图像数据压缩处理结果。
[0013]进一步地,所述档案图像为纸质档案图像扫描后的图像。
[0014]进一步地,所述图像字符灰度值评估包括:
[0015]获取图像中的字符像素位置,并采用Fast特征点检测算法检测该像素是否为字符像素;
[0016]按照下式计算文本图像字符平均灰度值:
[0017][0018]其中为文本图像字符平均灰度值,用于表示文本图像中文字区域像素点的灰度均值;g
i
表示第i个字符像素点灰度值,n表示字符像素个数。
[0019]进一步地,所述图像模糊度评估包括:
[0020]1)采用LSD直线检测算法,首先计算图像中所有点的梯度大小和方向,然后将梯度方向变化小且相邻的点作为一个连通域,并根据每一个域的矩形度判断是否需要按照规则将其断开以形成多个矩形度较大的域,最后对生成的域做改善和筛选,保留其中满足条件的域作为直线检测结果,通过LSD直线检测算法最终得到直线的起点与终点的坐标集合S
edge

[0021]2)对文本图像进行梯度方向检测,使用sabel算子得到图像梯度特征图,根据梯度特征图按照下式计算图像像素梯度方向α:
[0022][0023][0024]其中,f代表图像,x,y代表图像像素坐标;
[0025]根据以上公式得到图像所有像素的梯度变换方向特征图F
angle

[0026]3)遍历集合S
edge
计算平均扩展长度,对于集合S
edge
中任一像素点首先在F
angle
取得其梯度变换角度f
angle
,将360划分为8个区间,将f
angle
映射为相应的子方向f
dis
,沿着f
dis
正方向统计像素灰度递增的距离D
+
,沿着f
dis
反方向统计像素灰度递减的距离D

,将D
+
和D

求和得到X
ij
的扩展长度X
D

[0027]4)统计集合S
edge
中每个像素对应的扩展长度X
D
,求其平均最终得到文本图像的模糊度值
[0028]进一步地,所述步骤4包括:
[0029]通过文本质量评估得到图像平均灰度评估值和图像平均模糊度评估值根据文本质量评估结果构建图像标准化约束公式根据文本质量评估结果构建图像标准化约束公式对原始高清图像对数据集进行数据清洗,最终得到高清标准化图像对数据集。
[0030]进一步地,所述文本图像高清与数据压缩优化生成网络的数据处理流程包括:
[0031]1)给定训练图像I,经编码器生成相应的潜在表示y;
[0032]2)应用超编码器和超解码器模块来估计熵模型的参数:利用编码器的输出结果估计超先验分布参数和残差信息生成超先验分布参数z;超编码器输出的z经量化和算术编解码为作为超解码器的输入,重构超先验信息,估计熵模型中的参数,捕捉图像中的结构和纹理信息θ;
[0033]3)潜在表示y经量化器、算数编解码以及超编码器捕捉的图像结构和纹理信息θ后转换为
[0034]4)在送入解码器之前,先进入到特征增强模块,特征增强模块通过混合扩展卷积和空间金字塔池的结合,实现对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向文本高清标准化的图像数据压缩方法,其特征在于,包括:步骤1:生成档案图像;步骤2:对档案图像进行优化获得高清图像,将对应的原始档案图像和高清图像组合行成原始高清图像对,进而得到原始高清图像对数据集;步骤3:对原始高清图像对数据集进行文本质量评估;包括图像字符灰度值评估和图像模糊度评估;步骤4:根据文本质量评估结果,构建图像标准化约束公式,对原始高清图像对数据集进行数据清洗,最终得到高清标准化图像对数据集;步骤5:构建文本图像高清与数据压缩优化生成网络,并对构建的网络进行训练;所述网络包括编码器、超编码器、超解码器、解码器;步骤6:基于训练后文本图像高清与数据压缩优化生成网络对高清标准化图像对数据集进行处理,得到图像数据压缩处理结果。2.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法,其特征在于,所述档案图像为纸质档案图像扫描后的图像。3.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法,其特征在于,所述图像字符灰度值评估包括:获取图像中的字符像素位置,并采用Fast特征点检测算法检测该像素是否为字符像素;按照下式计算文本图像字符平均灰度值:其中为文本图像字符平均灰度值,用于表示文本图像中文字区域像素点的灰度均值;g
i
表示第i个字符像素点灰度值,n表示字符像素个数。4.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法,其特征在于,所述图像模糊度评估包括:1)采用LSD直线检测算法,首先计算图像中所有点的梯度大小和方向,然后将梯度方向变化小且相邻的点作为一个连通域,并根据每一个域的矩形度判断是否需要按照规则将其断开以形成多个矩形度较大的域,最后对生成的域做改善和筛选,保留其中满足条件的域作为直线检测结果,通过LSD直线检测算法最终得到直线的起点与终点的坐标集合S
edge
;2)对文本图像进行梯度方向检测,使用sabel算子得到图像梯度特征图,根据梯度特征图按照下式计算图像像素梯度方向α:图按照下式计算图像像素梯度方向α:其中,f代表图像,x,y代表图像像素坐标;根据以上公式得到图像所有像素的梯度变换方向特征图F
angle
;3)遍历集合S
edge
计算平均扩展长度,对于集合S
edge
中任一像素点首先在F
angle
取得其梯度变换角度f
angle
,将360划分为8个区间,将f
angle
映射为相应的子方向f
dis
,沿着f
dis
正方向
统计像素灰度递增的距离D
+
,沿着f
...

【专利技术属性】
技术研发人员:周兵刘向前李浩杨谨菏李凯江王俊淇
申请(专利权)人:河南郑大道可信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1