双层电子文件文本选择区域偏差的检测方法和系统技术方案

技术编号:5221333 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种双层电子文件文本选择区域偏差的检测方法和系统,以解决现有技术中双层电子文件的文本选择区域的视觉效果不佳的问题。该方法包括:获取双层电子文件文字层的单个字符的字块范围,并且获取所述双层电子文件图像层的单个字形图像的外接矩形范围;计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异,在其中至少一项差异大于预设值的情况下生成提示信息。根据本发明专利技术的技术方案,能够向用户提示对文本选择区域的偏差状态,供其参考以及对字体的尺寸进行调整,使在双层电子文件中作出的文本选择区域与字体区域对位准确,提高用户的体验。

【技术实现步骤摘要】

本专利技术涉及一种双层电子文件文本选择区域偏差的检测方法和系统
技术介绍
可移植文档格式(Portable Document Format,PDF)的双层电子文件例如书籍、文 件,是有图像层与文字层的PDF文件,图像层在上显示原书例如纸书的版面,上面每一个字 实际上是一个字形图像;文字层在图像层下面,并不显示出来,文字层中包含文件的电子版 文本,通常是使用光学字符识别(Optical Character Recognition, OCR)的方式获得。文 字层的文本与图像层的字形图像按字对位,图像层的每个字的下方就是该字在文字层中的 文本。用户在使用双层电子文件的阅读软件的选择工具时,因为上述的对位的关系,所 以根据图像层的显示就能够选择到文字层的用户需要的文本。图1是根据现有技术中使双 层电子文件的阅读软件进行文本选择的示意图。如图1所示,在方框10中的文本块内,双 层电子文件的阅读软件使用户选择时被选的区域变为黑色,但黑色区域与显示的文本的区 域重合度较低,例如方框11和方框12中的黑色区域没有完全覆盖被选字符,这样视觉效果 较差,特别是在行间距较小的情况下,更影响了用户的使用体验。现有的双层电子文件的文本选择区域的视觉效果不佳,对于该问题,目前尚未提 出有效解决方案。
技术实现思路
本专利技术的主要目的是提供一种双层电子文件文本选择区域偏差的检测方法和系 统,用以解决现有技术中双层电子文件的文本选择区域的视觉效果不佳的问题。为解决上述问题,根据本专利技术的一个方面,提供了一种双层电子文件文本选择区 域偏差的检测方法。本专利技术的双层电子文件文本选择区域偏差的检测方法包括获取双层电子文件文 字层的单个字符的字块范围,并且获取所述双层电子文件图像层的单个字形图像的外接矩 形范围;计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向 的差异,在其中至少一项差异大于预设值的情况下生成提示信息。进一步地,获取双层电子文件文字层的单个字符的字块范围包括获取双层电子 文件文字层的单个字符在文字层的坐标;将所述单个字符在文字层的坐标转换为在所述双 层电子文件的图像层的坐标;根据转化后的单个字符在所述图像层的坐标确定所述单个字 符的字块范围。进一步地,获取所述双层电子文件图像层的单个字形图像的外接矩形范围包括 搜索所述单个字形图像的边界;根据所述边界确定所述双层电子文件图像层的单个字形图 像的外接矩形范围。进一步地,生成提示信息包括在所述图像层的字 图像上添加矩形框,该矩形框的大小与所述文字层中对位于该字形图像的字符的字块范围相同。进一步地,所述双层电子文件为可移植文档格式(Portable Document Format)的 文件。为解决上述问题,根据本专利技术的另一方面,提供了一种双层电子文件文本选择区 域偏差的检测系统。本专利技术的双层电子文件文本选择区域偏差的检测系统包括第一获取模块,用于 获取双层电子文件文字层的单个字符的字块范围;第二获取模块,用于获取所述双层电子 文件图像层的单个字形图像的外接矩形范围;计算模块,用于计算对应于同一字符的所述 字块范围和所述外接矩形范围在高度方向和宽度方向的差异;输出模块,用于在所述计算 模块得出的两项差异中至少一项差异大于预设值的情况下生成提示信息。进一步地,所述第一获取模块还用于获取双层电子文件文字层的单个字符在文 字层的坐标;将所述单个字符在文字层的坐标转换为在所述双层电子文件的图像层的坐 标;根据转化后的单个字符在所述图像层的坐标确定所述单个字符的字块范围。进一步地,所述第二获取模块还用于搜索所述单个字形图像的边界;根据所述 边界确定所述双层电子文件图像层的单个字形图像的外接矩形范围。进一步地,所述输出模块还用于在所述图像层的字形图像上添加矩形框,该矩形 框的大小与所述文字层中对位于该字形图像的字符的字块范围相同。根据本专利技术的技术方案,根据双层电子文件文字层的单个字符的字块范围和图像 层的单个字形图像的外接矩形范围,确定对应于同一字符的所述字块范围和所述外接矩形 范围在高度方向和宽度方向的差异,这样就可以根据该差异提示用户,供其参考以及对字 体的尺寸进行调整,使在双层电子文件中作出的文本选择区域与字体区域对位准确,提高 用户的体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中图1是根据现有技术中使双层电子文件的阅读软件进行文本选择的示意图;图2是根据本专利技术实施例的双层电子文件文本选择区域偏差的检测方法的主要 步骤的示意图;图3是根据本专利技术实施例的输出文本选择区域偏差提示信息的示意图;以及图4是根据本专利技术实施例的双层电子文件文本选择区域偏差的检测系统的主要 模块的示意图。具体实施例方式下面将参考附图并结合实施例,来详细说明本专利技术。图2是根据本专利技术实施例的双层电子文件文本选择区域偏差的检测方法的主要 步骤的示意图。如图2所示,该方法包括如下的步骤S21至步骤S24。步骤S21 获取双层电子文件文字层的单个字符的字块范围,并且获取双层电子 文件图像层的单个字形图像的外接矩形范围。在本步骤中,获取双层电子文件文字层的单个字符的字块范围具体可以采用如下 步骤获取双层电子文件文字层的单个字符在文字层的坐标;将所述单个字符在文字层的 坐标转换为在所述双层电子文件的图像层的坐标;根据转化后的单个字符在图像层的坐标 确定所述单个字符的字块范围。在本步骤中,获取双层电子文件图像层的单个字形图像的外接矩形范围具体可以 采用如下步骤搜索单个字形图像的边界;根据所述边界确定所述双层电子文件图像层的 单个字形图像的外接矩形范围。步骤S22 计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向 和宽度方向的差异。因为图像层的每个字块下方对应于该字在文字层中的文本,因此可以 确定对应于同一字符的所述字块范围和所述外接矩形范围。步骤S23 判断步骤S22中得出的两项差异是否大于预设值,若其中至少一项差异 大于预设值,则进入步骤S24 ;否则返回步骤S21,不重复地获取下一个字符的字块范围。这 里的预设值可以是两个值,分别于用于与两项差异比较,也可以是一个值。预设值可以根据 显示时的字符大小和用户观察的敏锐程度来设定,例如设定为1.5mm或2mm,此时用户能够 明显看到选择区域与字体区域存在偏差。步骤S24 生成提示信息。生成提示信息可以是在图像层的字形图像上添加矩形 框,该矩形框的大小与文字层中对位于该字形图像的字符的字块范围相同。在生成提示信 息之后,可以根据用户的指令输出该提示信息。以上述的添加矩形框的方式为例,提示信息 的输出如图3所示,图3是根据本专利技术实施例的输出文本选择区域偏差提示信息的示意图。在图3中,方框30中的文本块经过检测,确认其中有若干文本的选择区域存在偏 差,具体例如方框31、方框32、方框33、方框34、方框35所示。方框30中是图像层的状态, 方框31至方框35则框出了文本层文字的范围。从图3中可以清晰地看到有哪些文本在选 择之后存在选择区域偏差,这样用户可以参考类似于图3中的提示将这些文本的尺寸在文 字层中进行调整。图4是根据本专利技术实施例的本文档来自技高网...

【技术保护点】
一种双层电子文件文本选择区域偏差的检测方法,其特征在于,包括:  获取双层电子文件文字层的单个字符的字块范围,并且获取所述双层电子文件图像层的单个字形图像的外接矩形范围;  计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异,在其中至少一项差异大于预设值的情况下生成提示信息。

【技术特征摘要】
一种双层电子文件文本选择区域偏差的检测方法,其特征在于,包括获取双层电子文件文字层的单个字符的字块范围,并且获取所述双层电子文件图像层的单个字形图像的外接矩形范围;计算对应于同一字符的所述字块范围和所述外接矩形范围在高度方向和宽度方向的差异,在其中至少一项差异大于预设值的情况下生成提示信息。2.根据权利要求1所述的检测方法,其特征在于,获取双层电子文件文字层的单个字 符的字块范围包括获取双层电子文件文字层的单个字符在文字层的坐标; 将所述单个字符在文字层的坐标转换为在所述双层电子文件的图像层的坐标; 根据转化后的单个字符在所述图像层的坐标确定所述单个字符的字块范围。3.根据权利要求1所述的检测方法,其特征在于,获取所述双层电子文件图像层的单 个字形图像的外接矩形范围包括搜索所述单个字形图像的边界;根据所述边界确定所述双层电子文件图像层的单个字形图像的外接矩形范围。4.根据权利要求1所述的检测方法,其特征在于,生成提示信息包括在所述图像层的 字形图像上添加矩形框,该矩形框的大小与所述文字层中对位于该字形图像的字符的字块 范围相同。5.根据权利要求1至4中任一项所述的检测方法,其特征在于,所述双层电...

【专利技术属性】
技术研发人员:周长岭赵海涛兰荣春
申请(专利权)人:方正国际软件有限公司
类型:发明
国别省市:32[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1