【技术实现步骤摘要】
本专利技术涉及。
技术介绍
存在能够描述电子文档的电子文档格式。例如,存在被称为PDF (便携文档格式) (注册商标)的格式。在这种电子文档中,可在PC上显示该电子文档。那么,可根据操作者的操作而在PC上选择电子文档中描述的文本信息,以便执行 诸如复制粘贴之类的处理。在PC上选择文本信息时(例如,可通过在显示了电子文档的显 示器所示出的文本的位置处左击鼠标、并同时向右移动文本的位置,来选择文本信息),提 供了一个指示标记来使所选文本的位置被反色(invert),以显示选择了哪些文本。另一方面,字符的图像被类似地识别出来以形成电子文档。例如,作为现有技术,JP-A-4-167188公开了一个字符串成形装置,该装置包括 矩形提取单元,用于从输入图像中提取对字符或者字符元素定界的矩形;可变倍率处理单 元,用于根据从可指定的多个模式中指定的模式来对矩形提取单元所提取的矩形中的图像 施加可变倍率处理;坐标转换单元,用于根据从可指定的多个模式中指定的模式来对矩形 提取单元所提取的矩形的坐标进行转换;以及输出单元,用于通过根据坐标转换单元所转 换之后的坐标控制打印设置位置来 ...
【技术保护点】
一种信息处理器,其包括:排提取单元,其利用矩形的信息来提取排,其中每个矩形都包围了电子文档中的像素块,所述排是包括电子文档中的行和列的任意排;段落提取单元,其对包含了所述排提取单元所提取的排的段落进行提取;段落整合单元,其对所述段落提取单元所提取的段落进行整合;矩形计算单元,其根据包含在整合后的段落中的排的大小以及形成了包含在整合后的段落中的排的像素块的位置来计算包围了包含在整合后的段落中的像素块的矩形的位置及大小以及包含在整合后的段落中的像素块与相应的矩形之间的位置关系,其中所述排的大小表示行高或者列宽。
【技术特征摘要】
JP 2009-2-13 2009-031158一种信息处理器,其包括排提取单元,其利用矩形的信息来提取排,其中每个矩形都包围了电子文档中的像素块,所述排是包括电子文档中的行和列的任意排;段落提取单元,其对包含了所述排提取单元所提取的排的段落进行提取;段落整合单元,其对所述段落提取单元所提取的段落进行整合;矩形计算单元,其根据包含在整合后的段落中的排的大小以及形成了包含在整合后的段落中的排的像素块的位置来计算包围了包含在整合后的段落中的像素块的矩形的位置及大小以及包含在整合后的段落中的像素块与相应的矩形之间的位置关系,其中所述排的大小表示行高或者列宽。2.如权利要求1所述的信息处理器,进一步包括字符数据形成单元,其形成字符数据,在字符数据中,所述矩形计算单元所计算出来的 矩形的信息与被所计算的矩形包围的像素块相结合。3.如权利要求2所述的信息处理器,其中所述字符数据形成单元将表示一个像素块的信息与一个或多个矩形的信息结合起来, 以形成字符数据。4.如权利要求1所述的信息处理器,其中其中的每一个都包围了电子文档中的像素块的多个矩形的信息包括任意方向上的每 个矩形的位置,任意方向包括高度方向和宽度方向,以及所述排提取单元利用包围了像素块的每个矩形的位置来提取包含像素块的排的大小, 所述排的大小表示行高或者列宽。5.如权利要求1所述的信息处理器,其中所述段落提取单元通过利用所述排提取单元所提取的排的大小以及任意方向上的排 的位置来提取段落,其中所述排的大小表示行高或者列宽,任意方向包括高度方向和宽度 方向。6.如权利要求1所述的信息处理器,其中所述段落提取单元根据所述排提取单元所提取的排与作为将被提取的对象的段落之 间的位置关系来提取段落。7.如权利要求1所述的信息处理器,其中所述段落提取单元计算包围了所提取的段落的定界矩形的位置,作为所提取的段落的信息。8.如权利要求1所述的信息处理器,其中同一行或者同一列中包含了多个排,并且所述段落提取单元对所述多个排进行排序。9.如权利要求1所述的信息处理器,其中所述段落提取单元通过利用包含在所提...
【专利技术属性】
技术研发人员:久保田聪,关野雅则,
申请(专利权)人:富士施乐株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。