【技术实现步骤摘要】
一种用于档案的图像压缩方法、系统及介质
[0001]本专利技术涉及图像处理
,具体涉及一种用于档案的图像压缩方法、系统及介质。
技术介绍
[0002]纸质档案在进行档案数字化作业时,需要保证档案图像的字迹、图片清晰,这也意味着需要更高的分辨率和更大的文件占用,常规存储是根据像素点的冗余量进行压缩编码,然后进行存储,但档案文件中多数为文字,任意编码段在压缩、传输过程中发生网络卡顿、数据丢失都会使文字细节模糊,且这些信息的丢失没有规律性,故档案中重要信息丢失的概率和非重要信息丢失的概率相同,一旦发生数据丢失,容易直接导致档案文件损坏。
[0003]现有技术利用霍夫曼编码对档案的图像进行无损压缩,最大程度保留档案文件的有效信息,为海量档案文件的大规模存储和传输提供了技术参考,在根据表框内容进行冗余压缩时,不同的人书写字体大小有差异,会导致文字压边线、超边线(边线指表框的框线)的问题,因此,在对这种数据进行编码压缩时,会导致压边线、超边线的文字出现局部信息的缺失,从而导致数据不完整,使得数据压缩时同一内容分裂为多个编码 ...
【技术保护点】
【技术特征摘要】
1.一种用于档案的图像压缩方法,其特征在于,该方法包括:获取档案的待压缩图像及其灰度图像;根据档案内容将灰度图像分割为多个表框区域,获取表框区域中的超出框线的超线文字及其超出的框线;分别获取超线文字在其超出的框线两侧的表框区域内的文字部分对应的角点数量,根据超线文字的角点总数及其在对应表框区域内的角点数量分别计算该两个表框区域内的文字部分对文字整体的影响程度;根据表框区域内的文字部分对文字整体的影响程度、文字部分所对应的像素点个数计算该超线文字属于表框区域的归属值;根据超线文字对应两个表框区域的归属值的大小确定超线文字的超线部分对应的归属区域;设定所有表框区域编码顺序,根据超线文字的超线部分的表框区域及归属区域对应的编码顺序对超线文字的超线部分的编码顺序进行修正,根据修正后的编码顺序及正常文字的对应的表框区域的编码顺序依次对档案中表框区域的内容进行霍夫曼编码得到压缩数据。2.根据权利要求1所述的一种用于档案的图像压缩方法,其特征在于,获取表框区域中的超出框线的超线文字的步骤包括:获取档案的待压缩图像对应的标准图像;将标准图像、待压缩图像中对应的表框区域进行匹配获取待压缩图像的框线像素点中的异常像素点;根据异常像素点与其邻域内像素点的灰度值获取文字笔画的对应的连接像素点集合并获取文字笔画的方向,分割出灰度图像中的每个文字并将有异常像素点的文字记为超线文字。3.根据权利要求2所述的一种用于档案的图像压缩方法,其特征在于,将标准图像、待压缩图像中对应的表框区域进行匹配获取待压缩图像的框线像素点中的异常像素点的步骤包括:获取标准图像、待压缩图像中对应的两个表框区域的框线像素点的灰度值;计算对应的两个表框区域中相对位置的框线像素点的第一灰度差值;根据第一灰度差值及预设的第一差值阈值确定框线像素点中的异常像素点。4.根据权利要求2所述的一种用于档案的图像压缩方法,其特征在于,根据异常像素点与其邻域内其余像素点的灰度值获取文字笔画的对应的连接像素点集合并获取文字笔画的方向的步骤包括:获取异常像素点与其6邻域内的像素点的第二灰度差值,其中,异常像素点在水平框线时,6邻域内的像素点为异常像素点的8邻域内去除异常像素点左右邻域的像素点所剩余的像素点;异常像素点在竖直框线时,6邻域内的邻域像素点为异常像素点的8邻域内去除异常像素点上下邻域的像素点所剩余的像素点;根据第二灰度差值与预设的第二差值阈值确定异常像素点的邻域内的连接像素点;依次获取将连接像素点作为异常像素点时其8邻域内对应的连接像素点,得到多个连接像素点构成该异常像素点的连接像素点集合;并获取每个异常像素点对应的连接像素点
集合;将每个异常像素点与其对应的连接像素点集合中的连接像素点依次连接形成文字笔画的方向。5.根据权利要求1所述的一种用于档案的图像压缩方法,其特征在于,根据超线文字的角点总数及其在对应表框区域内的角点数量分别计算该两个表框区域内的文字部分对文字整体的影响程度的步骤包括:分别获取超线文字在对应表框区域的文字部分中每个笔画的每两...
【专利技术属性】
技术研发人员:成浩,王鹏,魏小斌,文斐,张东,王辉,潘杰,
申请(专利权)人:中科金勃信山东科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。