图像处理设备和图像处理方法技术

技术编号:7851702 阅读:135 留言:0更新日期:2012-10-13 08:34
本发明专利技术提供了图像处理设备和图像处理方法。图像处理设备包括:结构信息获取部分,其从包含在以预定顺序排列的多个图像数据的每一个中、并且由多行和多列形成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;列表连接确定部分,其根据所获取的列表信息确定分别包含于所述多个图像数据中的列表中的一组连接列表、以及连接列表的连接方向;以及列表连接部分,其按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的该组列表。

【技术实现步骤摘要】
图像处理设备和图像处理方法
本专利技术涉及图像处理设备和图像处理方法。
技术介绍
例如,JP-A-04-023185(专利文献1)公开了一种列表读取装置,该列表读取装置通过适当定位由多个页所形成的打印文档中包含的诸如图片和列表之类的浮动元素,来产生诸如XML文档或HTML文档之类的结构化文档。例如,JP-A-05-342408(专利文献2)公开了一种文档图像归档装置,该文档图像归档装置对输入文档图像进行归档,以便根据每个属性对每个区域(句子、照片、以及图形)应用原始属性。例如,JP-A-2002-073598(专利文献3)公开了一种文档处理装置,该文档处理装置从电子文档中提取诸如“文本”、“图片”和“列表”之类的内容(组成部分),从而集中地处理它们或者再次使用它们。例如,JP-A-09-128480(专利文献4)公开了一种图案提取装置,该图案提取装置即使在构成框(其代表字符、图像和符号的图案区域)的线模糊的情况下也能提取图案区域。例如,JP-A-08-044827(专利文献5)公开了一种数字复印机,当在数字复印机中根据原件的类型而将它们分成多个区域时,该数字复印机也使得原件能够被再次本文档来自技高网...
图像处理设备和图像处理方法

【技术保护点】

【技术特征摘要】
2011.03.28 JP 2011-0695751.一种图像处理设备,包括:字符图像形成处理部分,其根据多个图像数据产生用于生成电子文档的字符图像形成数据;OCR部分,其针对从所述字符图像形成处理部分输入的字符图像形成数据来指定所述图像数据中的字符和字符位置;格线校正处理部分,其对来自所述多个图像数据的列表对象的格线的褪色和倾斜执行校正处理;以及列表图像形成处理部分,其根据所述列表对象产生列表图像形成数据,在所述列表图像形成数据中,对从所述OCR部分输入的字符数据和从所述格线校正处理部分输入的格线进行了校正,其中,所述列表图像形成处理部分包括:结构信息获取部分,其从包含在以预定顺序排列的多个图像数据的每一个中的、并且由多行和多列形成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;列表连接确定部分,其根据所获取的结构信息来确定在分别包含于所述多个图像数据中的列表当中的一组连接列表、以及所述连接列表的连接方向;以及列表连接部分,其按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的所述一组连接列表。2.根据权利要求1所述的图像处理设备,其中,所述列表连接确定部分用于:确定分别包含在所述多个图像数据中的多个列表的列信息是否彼此一致,将列信息被确定为彼此一致、并且以所述多个图像数据被列出的顺序彼此邻接的多个列表确定为所述一组连接列表,以及将所述连接方向确定为列表的向下方向。3.根据权利要求2所述的图像处理设备,其中每个列信息还包括:对构成每个列表并且唯一地由行和列指定的单元的属性进行表示的属性信息。4.根据权利要求3所述的图像处理设备,其中,所述属性信息包括构成列表的各个单元的颜色信息,以及其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的颜色信息是否彼此一致。5.根据权利要求3所述的图像处理设备,其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的底纹图案是否彼此一致。6.根据权利要求4所述的图像处理设备,其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的底纹图案是否彼此一致。7.根据权利要求3所述的图像处理设备,其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。8.根据权利要求4所述的图像处理设备,其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。9.根据权利要求5所述的图像处理设备,其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。10.根据权利要求6所述的图像处理设备,其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。11.根据权利要求1所述的图像处理设备,其中,所述列表连接确定部分用于:确定分别包含在所述多个图像数据中的多个列表的行信息是否彼此一致,...

【专利技术属性】
技术研发人员:山田俊之土渊清隆清水淳一新名博胁山彻也
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1