图像处理装置和图像处理装置的控制方法制造方法及图纸

技术编号:20224738 阅读:26 留言:0更新日期:2019-01-28 22:45
本发明专利技术提供图像处理装置和图像处理装置的控制方法。所述图像处理装置包含从图像数据抽取文字区域的布局分析部、生成文字区域的文字的文本数据的OCR处理部、以及文档文件生成部。文档文件生成部根据文字区域的大小,选择第一生成处理或第二生成处理。第一生成处理是生成粘贴有包含文本数据的文本框的文档文件的处理。第二生成处理是不使用文本框、而直接记入文本数据生成文档文件的处理。

【技术实现步骤摘要】
图像处理装置和图像处理装置的控制方法
本专利技术涉及转换图像数据并生成文档文件的图像处理装置。
技术介绍
有时会将纸质文档(原稿)电子化。进行电子化时,须读取原稿。有时将读取得到的图像数据进行转换,生成与图像数据的文件形式不同形式的文件。以下这种关于纸质文档的电子化的一例技术已被公众所知。具体公开有一种图像处理装置,识别图像的区域、进行与图像的区域对应的图像处理,并将图像处理过的数据结构化、生成表示图像的内容的内容数据,生成多个转换数据,所述转换数据用于基于区域识别将内容数据转换为各应用程序软件能利用的数据。原稿包含字符串和表等多种信息。根据信息的种类,适合编辑的软件不同。因此,对读取得到的图像数据进行转换时,有时会同时生成形式不同的多个文件。相比按照编辑中使用的各种软件生成文件,需要减小制作的数据的总量。将纸质文档(原稿)电子化时,进行原稿的读取。有时将读取得到的图像数据转换为特定形式的文件。而且,有时能设定如何转换。例如,使用者从多个转换方法中选择一个方法。例如,使用者选择能顺利编辑转换后的文件的转换方法。图像处理装置应用设定的方法,从图像数据生成新的文件。需要考虑原稿的页面的内容和生成的文件的使用目的,选择合适的转换方法。以往,将多个原稿连续电子化时,将选择的一个方法应用于所有页面。而原稿所含的信息(内容)每页都不尽相同。例如,有含表的页面,也有不含表的页面。此外,有文字多的页面,也有文字少的页面。因此,有时会出现转换方法不适合的页面。另一方面,为防止不适当的转换,也可考虑按一个个页面设定转换方法。可是,存在一个个页面设定转换方法给使用者带来负担的问题。这里,上述的公知技术是用于减小制作的数据的总量的技术。因此,上述的公知技术不能解决上述的问题。
技术实现思路
鉴于上述现有技术的问题,本专利技术的目的是以使文档文件的编辑作业变得容易的方式自动选择文档文件的生成处理,从而消除使用者的麻烦。本专利技术的图像处理装置包含布局分析部、OCR处理部、文档文件生成部。所述布局分析部分析图像数据的布局。所述布局分析部从所述图像数据抽取包含文字的文字区域。所述OCR处理部识别所述文字区域所含的文字。所述OCR处理部生成文本数据。所述文档文件生成部用所述文字区域的面积除以所述文字区域和所述文字区域以外的区域的合计面积而求出比率。当所述比率不足阈值时,所述文档文件生成部通过第一生成处理生成文档文件。当所述比率在所述阈值以上时,所述文档文件生成部通过第二生成处理生成所述文档文件。所述第一生成处理是生成粘贴有包含所述文本数据的文本框的所述文档文件的处理。所述第二生成处理是不使用所述文本框、而直接记入所述文本数据生成所述文档文件的处理。此外,本专利技术的图像处理装置的控制方法,包括:分析图像数据的布局,从所述图像数据抽取包含文字的文字区域;识别所述文字区域所含的文字,生成文本数据;用所述文字区域的面积除以所述文字区域和所述文字区域以外的区域的合计面积而求出比率;当所述比率不足阈值时,通过第一生成处理生成文档文件;当所述比率在所述阈值以上时,通过第二生成处理生成所述文档文件;所述第一生成处理是生成粘贴有包含所述文本数据的文本框的所述文档文件的处理;所述第二生成处理是不使用所述文本框、而直接记入所述文本数据生成所述文档文件的处理。按照本专利技术的图像处理装置和图像处理装置的控制方法,可以从基于图像数据的文档文件的多个生成处理中,自动选择使文档文件的编辑作业变得容易的生成处理。可以消除使用者的麻烦。在以下所示的实施方式中进一步说明本专利技术的更多特征和优点。附图说明图1是表示实施方式的数码复合机的一例的图。图2是表示实施方式的图像读取部和控制部的一例的图。图3是表示读取原稿得到的图像数据的一例的图。图4是表示通过实施方式的第一生成处理生成的文档文件的一例的图。图5是表示通过实施方式的第一生成处理生成的XML形式的文件的一例的图。图6是表示图像数据(原稿)的另一例的图。图7是表示通过实施方式的第二生成处理生成的文档文件的一例的图。图8是表示通过实施方式的第二生成处理生成的XML形式的文件的一例的图。图9是表示实施方式的数码复合机中的文档文件的生成的流程的一例的图。具体实施方式鉴于上述现有技术的问题点,本专利技术以使文档文件的编辑作业变得容易的方式自动选择文档文件的生成处理,从而消除使用者的麻烦。以下,采用图1~图9,说明实施方式的图像处理装置。作为图像处理装置以数码复合机100为例进行说明。数码复合机100除了能读取原稿,还能进行印刷、发信。数码复合机100也是图像形成装置。本实施方式的说明中记述的构成、配置等各要素不限制专利技术的范围,仅仅是说明示例。(数码复合机100)采用图1,说明实施方式的数码复合机100的一例。如图1所示,数码复合机100包含控制部1、存储部2、操作面板3、印刷部4、通信部5、图像读取部6、原稿输送部7。控制部1控制数码复合机100。控制部1包含CPU11和图像处理部8。存储部2包含ROM、闪存ROM、存储器(HDD)等非易失性存储装置。存储部2也包含RAM等易失性存储装置。控制部1利用存储部2中存储的程序和数据对各部分进行控制。此外,控制部1控制原稿读取和图像数据的生成。图像处理部8是图像处理专用的集成电路。例如,图像处理部8为ASIC。图像处理部8进行图像数据的图像处理。操作面板3包含显示面板31、接触面板32、硬键33。控制部1使显示面板31显示设定用画面和操作用图像。操作用图像为例如按钮、键、选项。根据接触面板32的输出,控制部1识别被操作的操作用图像。硬键33包含开始键和数码键。接触面板32、硬键33受理使用者的设定操作。控制部1和操作面板3通信。控制部1识别设定内容。印刷部4包含供纸部4a、纸输送部4b、图像形成部4c和定影部4d。印刷作业时,控制部1使供纸部4a供给纸张。控制部1使纸输送部4b输送纸张。纸输送部4b将印刷结束纸张向机外排出。控制部1使图像形成部4c形成基于图像数据的调色剂像。控制部1使图像形成部4c向输送纸张转印调色剂像。控制部1使定影部4d将转印的调色剂像定影到纸张上。控制部1控制印刷部4的动作。通信部5和计算机200能通信地连接。通信部5和计算机200借助网络通信。通信部5包含通信用电路和通信用软件。通信部5接收从计算机200发送来的印刷用数据。印刷用数据包含图像数据和用页面记述语言记述的数据。控制部1使印刷部4根据接收的印刷用数据进行印刷(打印作业)。图像读取部6包含原稿玻璃(未图示),原稿玻璃透光。原稿设置在原稿玻璃上。图像读取部6向设置在原稿玻璃上的原稿照射光。图像读取部6通过读取原稿的下侧的面,生成图像数据。控制部1将生成的图像数据存储在存储部2中。此外,原稿输送部7能开闭。关闭时,原稿输送部7按压原稿玻璃上的原稿。原稿输送部7将设置的原稿自动地1枚枚向读取位置(输送读取用接触玻璃)输送。输送读取用玻璃(未图示)设置在图像读取部6上。输送原稿在输送读取用玻璃上通过。图像读取部6向通过输送读取用接触玻璃的原稿照射光。图像读取部6读取原稿并生成图像数据。控制部1将生成的图像数据存储在存储部2中。(图像读取部6和控制部1)接下来,采用图2、图3,说明实施方式的图像读取部6和控制部1的一例。本文档来自技高网
...

【技术保护点】
1.一种图像处理装置,其特征在于包括:布局分析部,分析图像数据的布局,从所述图像数据抽取包含文字的文字区域;OCR处理部,识别所述文字区域所含的文字,生成文本数据;以及文档文件生成部,所述文档文件生成部用所述文字区域的面积除以所述文字区域和所述文字区域以外的区域的合计面积而求出比率,当所述比率不足阈值时,所述文档文件生成部通过第一生成处理生成文档文件,当所述比率在所述阈值以上时,所述文档文件生成部通过第二生成处理生成所述文档文件,所述第一生成处理是生成粘贴有文本框的所述文档文件的处理,所述文本框包含所述文本数据,所述第二生成处理是不使用所述文本框、而直接记入所述文本数据生成所述文档文件的处理。

【技术特征摘要】
2017.07.18 JP 2017-1391241.一种图像处理装置,其特征在于包括:布局分析部,分析图像数据的布局,从所述图像数据抽取包含文字的文字区域;OCR处理部,识别所述文字区域所含的文字,生成文本数据;以及文档文件生成部,所述文档文件生成部用所述文字区域的面积除以所述文字区域和所述文字区域以外的区域的合计面积而求出比率,当所述比率不足阈值时,所述文档文件生成部通过第一生成处理生成文档文件,当所述比率在所述阈值以上时,所述文档文件生成部通过第二生成处理生成所述文档文件,所述第一生成处理是生成粘贴有文本框的所述文档文件的处理,所述文本框包含所述文本数据,所述第二生成处理是不使用所述文本框、而直接记入所述文本数据生成所述文档文件的处理。2.根据权利要求1所述的图像处理装置,其特征在于,包括:原稿输送部,将原稿1枚枚输送到读取位置;以及图像读取部,读取输送来的原稿,生成所述图像数据,在连续输送原稿、所述图像读取部连续生成所述图像数据时,所述布局分析部一个个页面地进行由所述图像读取部生成的所述图像数据的布局的分析和区域的抽取,所述文档文件生成部,一个个页面地选择是进行所述第一生成处理和所述第二生成处理中的哪一个,并通过进行所选择的处理,生成对各页面的所述图像数据进行转换的所述文档文件。3.根据权利要求1或2所述的图像处理装置,其特征在于,所述布局分析部从所述图像数据抽取所述文字区域、包含图的图区域、包含表的表区域,所述文档文件生成部,将所述文字区域、所述图区域及所述表区域的合计设为所述合计面积,生成将所述图区域作...

【专利技术属性】
技术研发人员:桂健一
申请(专利权)人:京瓷办公信息系统株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1