The document discloses a document processing device, an image processing device, and a document processing method. A document processing apparatus includes a unit extract character information, extract character information from the document image data; feature string extraction unit, from the character information extraction unit extracts the character information extraction, indicating the characteristics of the document image data of a given number of character string as the document name candidate string; output acquisition unit with one of a plurality of processing method when the output data from the document image relates to the document name of the document image data, output output output condition acquiring unit acquires the document image data of the document name required; and document name generating unit from the candidate generation and the corresponding document name string in the condition of output character conditions consistent with the document name.
【技术实现步骤摘要】
文档处理设备、图像处理装置和文档处理方法相关申请的交叉引用本申请要求于2012年12月7日在日本提交的日本专利申请No.2012-267869的优先权权益,其全部内容通过引用方式并入到本文中。
本专利技术涉及文档处理设备、图像处理装置和文档处理方法,并且更具体地涉及如下这样的文档处理设备、图像处理装置和文档处理方法,所述文档处理设备、图像处理装置和文档处理方法为文档图像数据创建适合于如下输出条件的样式的文档名称,所述输出条件不仅依赖于所述文档图像数据被输出的时间并且还依赖于所述文档图像数据被输出到的目的地。
技术介绍
外部加载的文档图像数据包括并未向其给出文档名称的文档图像数据,并且特别是,需要向通过扫描设备从纸质文档加载的文档图像数据给出文档名称以用于存储管理,从而能够更有效地使用文档数据。存在向这样加载的图像数据给出文档名称的常规方法,其中自动创建并给出加载日期、预定序列号等。然而,存在这样的问题,其中无法仅从日期或序列号确定文档图像数据的文档内容,这导致文档图像数据的不良使用性。通常,用户将与加载的文档图像数据的内容相对应的文档名称输入给文档图像数据。这允许其他的用户根据文档名称知晓文档图像数据的内容,这改善了其使用性。然而,如果存在大量的文档图像数据,就降低了操作性,这种情况需要被改进。因此,已经提出了从文档图像数据自身提取与文档图像数据的内容相对应的标题的各种技术。例如,存在这样的方法,即从通过对文档图像数据执行光学字符识别(OCR)扫描的文档提取每个候选标题语句的特征量并且随后提取标题,从而特征量包括相似度信息,所述相似度信息是相对于文档中的多 ...
【技术保护点】
一种文档处理设备,包括:字符信息提取单元,用于从文档图像数据提取字符信息;特征字符串提取单元,用于从由所述字符信息提取单元提取的字符信息中,提取指示所述文档图像数据的特征的给定数量的字符串作为文档名称候选字符串;输出条件获取单元,当由涉及所述文档图像数据的文档名称的输出的多个处理方法之一处理所述文档图像数据时,所述输出条件获取单元获取所述文档图像数据的文档名称的输出所需的输出条件;以及文档名称生成单元,用于从所述文档名称候选字符串生成与对应于所述输出条件的字符条件相一致的文档名称,其中,当所述输出条件所对应的输出方法是文件夹传输或电子邮件传输时,则所述文档名称生成单元基于输出目的地来生成与所述字符条件相一致的文档名称,所述字符条件是指考虑在输出目的地设备中能够被使用的字符代码;并且当所述输出条件所对应的输出方法是电子介质写入时,则所述文档名称生成单元基于输出目的地,不考虑所述字符条件而直接使用先前存储的各个字符代码生成文档名称。
【技术特征摘要】
2012.12.07 JP 2012-2678691.一种文档处理设备,包括:字符信息提取单元,用于从文档图像数据提取字符信息;特征字符串提取单元,用于从由所述字符信息提取单元提取的字符信息中,提取指示所述文档图像数据的特征的给定数量的字符串作为文档名称候选字符串;输出条件获取单元,当由涉及所述文档图像数据的文档名称的输出的多个处理方法之一处理所述文档图像数据时,所述输出条件获取单元获取所述文档图像数据的文档名称的输出所需的输出条件;以及文档名称生成单元,用于从所述文档名称候选字符串生成与对应于所述输出条件的字符条件相一致的文档名称,其中,当所述输出条件所对应的输出方法是文件夹传输或电子邮件传输时,则所述文档名称生成单元基于输出目的地来生成与所述字符条件相一致的文档名称,所述字符条件是指考虑在输出目的地设备中能够被使用的字符代码;并且当所述输出条件所对应的输出方法是电子介质写入时,则所述文档名称生成单元基于输出目的地,不考虑所述字符条件而直接使用先前存储的各个字符代码生成文档名称。2.如权利要求1所述的文档处理设备,其中,所述输出条件获取单元获取在所述输出目的地设备中可用的被先前存储作为字符串调节规则的字符代码作为所述输出条件,并且所述文档名称生成单元使用作为所述输出条件的字符代码作为所述字符条件,并且使用所述字符代码生成所述文档名称。3.如权利要求1所述的文档处理设备,其中,当所述输出条件获取单元获取将所述文档名称被输出到的目的地存储在存储介质中的输出条件时,所述文档名称生成单元使用在所述文档图像数据中使用的字符代码作为所述字符条件,并且使用所述字符代码生成所述文档名称。4.如权利要求1所述的文档处理设备,其中,当所述输出条件获取单元获取通过电子邮件发送或数据传输输出所述文档名称到的目的地是不同的设备的输出条件...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。