面向文本高清标准化的图像数据压缩方法及系统技术方案

技术编号：39324862 阅读：9 留言：0更新日期：2023-11-12 16:03

本发明专利技术公开一种面向文本高清标准化的图像数据压缩方法及系统，包括：对档案图像进行优化获得高清图像，将对应的原始档案图像和高清图像组合行成原始高清图像对；对原始高清图像对数据集进行文本质量评估；根据文本质量评估结果，构建图像标准化约束公式，对原始高清图像对数据集进行数据清洗，最终得到高清标准化图像对数据集；构建文本图像高清与数据压缩优化生成网络，并对构建的网络进行训练；基于训练后文本图像高清与数据压缩优化生成网络对高清标准化图像对数据集进行处理，得到图像数据压缩处理结果。本发明专利技术针对档案图像采用Transformer网络框架与超先验技术的结合，能够在保证图像质量的前提下，有效实现图像数据的压缩。的压缩。的压缩。

全部详细技术资料下载

【技术实现步骤摘要】
面向文本高清标准化的图像数据压缩方法及系统

[0001]本专利技术涉及图像处理
，尤其涉及一种面向文本高清标准化的图像数据压缩方法及系统。

技术介绍

[0002]数字化档案进程中需要通过调整图像文本模糊度和灰度，使扫描的原始档案图像优化为符合质量要求的高清标准化图像。同时，为了节省硬件存储资源和提高数字化文本图像的传输速度，需要对图像进行必要的压缩处理。然而，如何有效实现在档案图像高清标准化及图像数据压缩联合任务是一个关键挑战。
[0003]在图像高清技术中，降噪技术在一定程度上可以减少图像中的噪声，提高图像的清晰度。但是，过度的降噪会导致图像细节的丢失和模糊，影响图像的质量。在数据压缩技术中，JPEG等技术关注于如何提高压缩比，对图像噪声和失真的容忍度较低。且现有的图像高清和数据压缩方法，往往实现单个任务，很难根据原始图像信息分布、针对性地进行数据压缩且保证图像文本灰度和模糊度的质量标准约束。

技术实现思路

[0004]本专利技术针对现有的图像高清和数据压缩方法，往往实现单个任务，很难根据原始图像信息分布、针对性地进行数据压缩且保证图像文本灰度和模糊度的质量标准约束的问题，提出了一种面向文本高清标准化的图像数据压缩方法及系统，该方法主要包含两部分：文本图像高清标准化评估方法与文本图像高清与数据压缩优化生成网络。该方法针对档案图像，采用了Transformer网络框架与超先验技术的结合，能够在保证图像质量的前提下，有效实现图像数据的压缩。针对档案数字化进程中人工图像质量评估的不确定性，本...

【技术保护点】

【技术特征摘要】
1.一种面向文本高清标准化的图像数据压缩方法，其特征在于，包括：步骤1：生成档案图像；步骤2：对档案图像进行优化获得高清图像，将对应的原始档案图像和高清图像组合行成原始高清图像对，进而得到原始高清图像对数据集；步骤3：对原始高清图像对数据集进行文本质量评估；包括图像字符灰度值评估和图像模糊度评估；步骤4：根据文本质量评估结果，构建图像标准化约束公式，对原始高清图像对数据集进行数据清洗，最终得到高清标准化图像对数据集；步骤5：构建文本图像高清与数据压缩优化生成网络，并对构建的网络进行训练；所述网络包括编码器、超编码器、超解码器、解码器；步骤6：基于训练后文本图像高清与数据压缩优化生成网络对高清标准化图像对数据集进行处理，得到图像数据压缩处理结果。2.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法，其特征在于，所述档案图像为纸质档案图像扫描后的图像。3.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法，其特征在于，所述图像字符灰度值评估包括：获取图像中的字符像素位置，并采用Fast特征点检测算法检测该像素是否为字符像素；按照下式计算文本图像字符平均灰度值：其中为文本图像字符平均灰度值，用于表示文本图像中文字区域像素点的灰度均值；g
i
表示第i个字符像素点灰度值，n表示字符像素个数。4.根据权利要求1所述的面向文本高清标准化的图像数据压缩方法，其特征在于，所述图像模糊度评估包括：1)采用LSD直线检测算法，首先计算图像中所有点的梯度大小和方向，然后将梯度方向变化小且相邻的点作为一个连通域，并根据每一个域的矩形度判断是否需要按照规则将其断开以形成多个矩形度较大的域，最后对生成的域做改善和筛选，保留其中满足条件的域作为直线检测结果，通过LSD直线检测算法最终得到直线的起点与终点的坐标集合S
edge
；2)对文本图像进行梯度方向检测，使用sabel算子得到图像梯度特征图，根据梯度特征图按照下式计算图像像素梯度方向α：图按照下式计算图像像素梯度方向α：其中，f代表图像，x,y代表图像像素坐标；根据以上公式得到图像所有像素的梯度变换方向特征图F
angle
；3)遍历集合S
edge
计算平均扩展长度，对于集合S
edge
中任一像素点首先在F
angle
取得其梯度变换角度f
angle
，将360划分为8个区间，将f
angle
映射为相应的子方向f
dis
，沿着f
dis
正方向
统计像素灰度递增的距离D
+
，沿着f
...

【专利技术属性】
技术研发人员：周兵，刘向前，李浩，杨谨菏，李凯江，王俊淇，
申请(专利权)人：河南郑大道可信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人