当前位置: 首页 > 专利查询>南开大学专利>正文

一种对平面媒体图像进行适应屏幕阅读的重排方法技术

技术编号:7786888 阅读:301 留言:0更新日期:2012-09-21 08:19
本发明专利技术涉及一种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤:(1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;(2)对图文混排的平面媒体图像进行图文分离处理;(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为屏幕宽度的图像。本发明专利技术设计合理,不需要对文字进行识别即可满足不同分辨率的手持移动设备或大屏幕显示设备自适应显示的需要,同时通过对漫画自动识别边框将漫画分割成单幅漫画,解决了手持移动设备阅读漫画的问题,具有准确性高、方法简单、效率高等特点。

【技术实现步骤摘要】

本专利技术属于信息
,尤其是ー种对平面媒体图像进行适应屏幕阅读的重排方法
技术介绍
随着互联网、数字影像技术的迅猛发展,数字媒体得以广泛传播,随之而来的是人们对电子阅读方式、特别是跨越不同设备之间阅读方式的需求越来越大。人们普遍希望能够使用手持移动设备阅读各种来源、版式不同的文章,例如图像式PDF或者来源于摄像头拍摄的电子书籍。由于手持移动设备通常只有3-4吋的屏幕可供显示,因此,手持移动设备在阅读图像式PDF或者来源于摄像头拍摄的电子书籍时,往往会产生屏幕尺寸不能满足图像大小的情况,如果缩放,文字太小,看不清楚;如果不缩放,则需要反复拖动图像才能阅读,操作麻烦;而相对于分辨率较高的大屏幕显示设备,例如,微型计算机的高分辨率显示 器、电视、投影等设备,会出现相反的情況。针对上述问题,目前主要采用OCR技术对文字进行识别来解決,但是采用OCR技术存在的问题是(I)识别率不完美,容易出错,给阅读带来不便;(2)含有插图的平面媒体图像需要去除插图,否则影响识别;(3)图像质量差、噪声多、影响识别;(4)算法复杂度高,在移动平台上费时多;(5)适用的字体过于局限,对于华文彩云、华文行楷很难识别。另外,手持移动设备在阅读漫画时存在如下问题虽然手持移动设备上安装有漫画阅读软件,但是这些软件相对封闭,不同软件用自己的独有格式,而且只能阅读软件开发者已经制作好的漫画,其阅读范围有限;即使有部分开放的软件,也需要用户自行分割漫画,耗费精力,并需要额外的学习软件使用。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供ー种对平面媒体图像进行适应目标屏幕阅读的重排方法,通过对平面媒体图像进行分割以实现版面的重排,解决了手持移动设备对于平面媒体图像阅读不便以及漫画阅读问题。本专利技术解决其技术问题是采取以下技术方案实现的ー种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤(I)对含有噪声、水印或傾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理;(2)对图文混排的平面媒体图像进行图文分离处理;(3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理;(4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。而且,所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。而且,所述步骤(I)的噪声去除方法为首先对光照不均的图像采取背景减除、小波变换实现ニ值化,然后利用高斯平滑、中值滤波等去除小噪点。而且,所述步骤(I)的水印去除预处理包括灰度处理、usm锐化和ニ值化处理步骤。而且,所述步骤(I)的傾斜度校正采用基于边缘检测的傾斜度校正算法实现,其处理步骤为通过提取倾斜图像边界像素点的坐标,利用最小二乗法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。而且,所述步骤(2)的图文分离处理方法为利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。而且,所述步骤(4)对正文图像进行分割重排处理包括多行文本正文图像分割重 排处理方法和漫画正文图像分割重排处理方法。而且,所述的多行文本正文图像分割重排处理方法包括以下步骤(I)采用下式计算行高RowHeight :RowHeight = RowEnd-RowBeg上式中,RowBeg为第一个不全为白色像素的行,RowEnd为下ー个不全为白像素的行;(2)以行高RowHeight为单行文字图像的高,把多行文字图像拼接成单行文字的图像;(3)设目标屏幕宽度为ScreenWide,直接找到单行文字图像的第ScreenWide列像素处,检验该列是否全为白像素,若是,则认为该列位于字与字之间,从该列像素处分割,否贝1J,对屏幕宽度ScreenWide处左侧的-列进行扫描,按上述方法循环下去,直到最后剩余的像素宽度小于等于屏幕宽度ScreenWide,扫描结束,从而实现对多行文本正文图像的分割重排功能。而且,所述的漫画正文图像分割重排处理方法是通过自动识别边框并将其分割为单幅画面实现对漫画正文图像的分割重排功能。而且,所述步骤(4)的目标屏幕为比原平面媒体图像分辨率低的手持移动设备,或者为屏幕分辨率比原平面媒体图像分辨率高的显示设备上;对正文图像进行分割重排处理适用于将小分辨率平面媒体图像在相对较大的设备上显示或将大分辨率平面媒体图像在相对较小设备上显示。本专利技术的优点和积极效果是I、本方法根据目标屏幕分辨率对平面媒体正文图像进行分割重排处理,对于比原图片分辨率小的手持移动设备,通过分割实现每行的文字数減少;对于原图分辨率大的显示设备,通过合并行再重新切分实现每行文字数増加,整个处理过程中不需要对文字进行识别即可满足各种分辨率显示设备的自适应显示需要,避免OCR技术带来的识别出错问题。2、本方法通过对漫画自动识别边框将漫画分割成单幅漫画,达到了适应屏幕阅读的目的,不需要另外安装漫画软件即可直接阅读,解决了手持移动设备阅读漫画的问题。附图说明图I是本专利技术的对多行文本进行分割重排处理的流程图;图2是行闻计算方法不意图;图3是多行文本正文图像示意图;图4是多行文本正文图像处理结果示意图;图5是漫画正文图像不意图;图6是漫画正文图像处理结果示意图。具体实施例方式以下结合附图对本专利技术实施例做进ー步详述ー种对平面媒体图像进行适应屏幕阅读的重排方法,是通过对平面媒体图像进行版面分块和文本的分割以实现版面的重排,以适应对于比原图片分辨率小的手持移动设备以及对于原图分辨率大的显示设备的现实需要。所谓的平面媒体图像,是指平面媒体经过转化,其内容已经不再以有序的方式存在,而是以图像形式存在,媒体内包含的文字已经无法编辑,也无法被机器设备识别而只能通过人来阅读,上述平面媒体图像既包括了带插图的电子读物,也包括没有文字的漫画读物,其中的文字方向可以是横向或者竖向排版,所使用的语言可以使汉语和英语等。下面对本专利技术进行详细说明—种对平面媒体图像进行适应屏幕阅读的重排方法,包括以下步骤步骤I :对含有噪声、水印或傾斜度的平面媒体图像分别进行噪声去除、水印去除或傾斜度校正预处理由于待重新排版的平面媒体图像包括手持移动设备通过摄像头采集的图像或者从其他方式传入的图像,这些图像可能会存在一定程度的倾斜和噪声,部分文档为了版权保护加有水印,因此,在本步骤中,需要对这些原始图像进行傾斜度校正、噪声去除、水印去除等预处理工作,以得到理想图像便于后续的处理。噪声去除是图像处理过程中的ー个重要环节,其结果直接影响到图像质量和特征提取的精确性。本噪声去除方法结合多种算法对图像进行噪声去除首先对光照不均的图像采取背景减除、小波变换实现ニ值化,然后利用高斯平滑、中值滤波等去除小噪点。水印去除预处理包括灰度处理、usm锐化和ニ值化处理步骤实现。傾斜度校正采用基于边缘检测的傾斜度校正算法实现,其通过提取倾斜图像边界像素点的坐标,利用最小二乗法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。步骤2 :对图文混排的平面媒体图像进行图文分离处理图文分离采取相对完美的算法,利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于包括以下步骤 (1)对含有噪声、水印或倾斜度的平面媒体图像分别进行噪声去除、水印去除或倾斜度校正预处理; (2)对图文混排的平面媒体图像进行图文分离处理; (3)对包含有页眉、页脚或标题的平面媒体图像的非正文内容部分进行剔除处理; (4)根据目标屏幕分辨率对正文图像进行分割重排处理,将正文图像分割成宽度为目标屏幕宽度的图像。2.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述的平面媒体图像包括摄像头采集的图像或者从其他方式传入的图像。3.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的噪声去除方法为首先对光照不均的图像采取背景减除、小波变换实现二值化,然后利用高斯平滑、中值滤波等去除小噪点。4.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的水印去除预处理包括灰度处理、usm锐化和二值化处理步骤。5.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(I)的倾斜度校正采用基于边缘检测的倾斜度校正算法实现,其处理步骤为通过提取倾斜图像边界像素点的坐标,利用最小二乘法对边界直线进行拟合,求出边界对于图像的倾斜角,进而对图像进行旋转变换,对原始倾斜的图像进行校正。6.根据权利要求I所述的一种对平面媒体图像进行适应屏幕阅读的重排方法,其特征在于所述步骤(2)的图文分离处理方法为利用图像和文字的连通域大小的显著区别,提取出连通域较大的图像,剩余较小的文字、标点。7.根据权利要求I所述的一种对平面媒体图像进行...

【专利技术属性】
技术研发人员:江亚庆张金杨子健张敬威刘鑫鑫姜洲罗俊
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1