第一区域提取单元通过将文件图像数据划分为文件区域单元而从文件图像数据中提取第一文件区域。语言确定单元确定文件图像数据中使用的语言的类型。第二区域提取单元基于对应于语言确定单元确定的语言类型的规则,通过划分或组合第一文件区域提取第二文件区域。
【技术实现步骤摘要】
,图像处理方法和计算机程序产品的制作方法
本专利技术涉及从图像数据中提取包括字符的区域的技术。
技术介绍
本专利技术包括并引用了于2005年10月7日申请的日本优先权文件第2005-295412的全部内容。通常,将由例如扫描仪和数码相机的图像输入装置输入到计算机中的文件图像分类为文件组成元素的过程,即分类为字符块、照片/图片/插图、表格和划线的过程称为“几何布局分析”或“页面分割”。通常对二进制文件图像进行“几何布局分析”或“页面分割”。此外,“几何布局分析”或“页面分割”和如预处理的“倾斜(skew)校正”相关,在“倾斜校正”过程中,校正输入时导致的倾斜。已经进行过倾斜校正的二进制文件图像的“几何布局分析”或“页面分割”分为两大类方法(由上而下的分析和由下而上的分析)。下面解释由上而下的分析。由上而下的分析将页面分解为大的组成元素,然后再分解为较小的组成元素。这种方法中,将较大的组成成份分解为较小的成份;例如,将页面分解为列,将每列分解为段,将每段分解为字符行。由上而下的分析通过使用基于页面布局结构(例如,Manhattan布局中的字符行是竖式的矩形)假设的模型,而对简便计算是是有利的。然而如果假设对于数据无效,存在一缺点即会产生致命错误。对于复杂的布局,在大多数情况下建模也会变得复杂,因此不容易处理复杂布局。接下来介绍由下而上的分析。在由下而上的分析中,如日本专利申请第2000-067158号和日本专利第3187895号中描述的那样,通过参考和相邻元素的位置关系来整合组成元素。这种方法中,将较小的组成元素分组到较大的元素下;例如,将相连的元素放成一行,将多行放成一栏。日本专利申请第2000-067158号中揭示了基于本地信息的由下而上的分析方法。尽管对于整个文件图像数据的布局来说,能够不过多依赖于假设就能处理多种布局,缺点在于本地产生的判断误差可能会被累积。如果错误地将跨越不同列的两个单词整合到一个字符行中,会错误地将两列作为一栏提取。此外,日本专利申请第3187895号中揭示的整合组成元素的方法需要知道字符序列的特征和每种语言的书写方向(垂直书写或水平书写)。如上所述,两种方法是彼此互补的,并且有一些方法可用于弥补二者之间的不同。在这些方法中,有的方法和语言的差异无关。这些方法包括使用部分而不是使用字符的方法,即,对二进制文件图像使用“背景”或所谓的“白色背景”。使用背景或白色背景的优势在于(1)因为不必考虑处理的是何种语言(白色背景在大多数语言中都作为断点),所以不需要知道书写方向(垂直书写或水平书写)。(2)广泛的处理不易导致累积的本地判断误差。(3)能够灵活地处理复杂的布局。在这些背景分析方法中,“最大白色块组页面分割”是典型的方法。下面将会简要地介绍“最大白色块组页面分割”。在此之前,先定义一下“最大白色块问题”。首先,分配rb用于指示对应于整个文件图像数据的块区域,分配C=(rirb;i=0,1,...,n)用于指示包括二进制文件图像的组合的黑色成份的块区域。图6描述了块区域的示例集。进一步地,为块引入满足下面描述的特征的评估函数Q。对于两个块r和r′,评估函数满足如果rr′,则Q(r)≤Q(r′)例如,当函数Q(r)是块r的区域时就满足上述特征。“最大白色块问题”是如何在和C,r0,r1,... ,rn(rirb;i=0,1,...n)元素不重叠的块中找到Q的最大值。对于这一问题的扩展,Document Image Analysis(H.Bunke,P.S.P.Wang,and H.S.Baird,Eds.),SingaporeWorld Scientific,1994,pp.17-34中H.S.Baird的“Background structure in document images”和Proceedings of IAPRWorkshop on Document Analysis Systems(Princeton,NJ,USA),2002中TMBreuel的“Two algorithms for geometric layout analysis”提出了针对“最大白色块”以降序排列提供Q值的算法,“最大白色块”即如果被进一步扩展将会和任一C元素重叠的白色块。通过以上述方法中一组最大白色块覆盖背景区域(二进制文件图像的空白区域),预期能够将例如列和文字行的文件组成元素作为“没有被任一白色块覆盖的部分”提取出来。然而,属于例如“最大白色块组页面分割”的背景分析的方法具有一个缺点难于处理特定语言的复杂布局。
技术实现思路
本专利技术的目的是至少部分解决现有技术中存在的问题。根据本专利技术的一个方面的包括第一区域提取单元,用于通过将文件图像数据划分为文件区域单元,从文件图像数据中提取第一文件区域;语言确定单元,用于确定文件图像数据中使用的语言的类型;和第二区域提取单元,基于对应于语言确定单元确定的语言类型的规则,通过划分或组合第一文件区域提取第二文件区域。根据本专利技术另一方面的图像处理方法包括通过将文件图像数据划分为文件区域单元,从文件图像数据提取第一文件区域;确定文件图像数据中使用的语言的类型;和基于对应于在语言确定时确定的语言类型的规则,通过划分或组合第一文件区域提取第二文件区域。根据本专利技术的另一方面的计算机程序产品包括计算机可用的媒体,所述媒体具有计算机可读程序代码并且在被执行时使得计算机执行通过将文件图像数据划分为文件区域单元,从文件图像数据提取第一文件区域;确定文件图像数据中使用的语言的类型;和基于对应于在语言确定时确定的语言类型的规则,通过划分或组合第一文件区域提取第二文件区域。当阅读下述关于本专利技术的优选实施例的详细描述及参考附图时,能够更好地理解本专利技术上述和其它目的,特点,优势和技术及产业重要性。附图说明图1是描述根据本专利技术第一实施例的的结构的框图;图2是描述根据第一实施例的存储在存储单元的提取规则对应表的结构的示意图;图3是描述根据第一实施例的经过的图像输入处理单元的输入处理后的二元化图像数据的示例的示意图; 图4是描述最大白色块的示例的示意图;图5是描述采用最大白色块组页面分割的布局分析处理的基本方法的示意图;图6是描述根据第一实施例的第一区域提取单元的区域提取结果的示例的示意图;图7是描述在划分区域的文件图像数据上执行的书写方向确定结果的示例的示意图;图8是描述根据第一实施例的第二区域提取单元的结构的框图;图9是描述根据第一实施例的经过日文垂直书写校正单元的区域提取的文件区域的示例的示意图;图10是描述根据第一实施例的由例如日文垂直书写校正单元的后处理校正单元在每个文件区域执行的提取处理的结果的示意图;图11是描述第一区域提取单元提取的包括大字体的文件图像数据的示例的示意图;图12是描述根据第一实施例的大字体校正单元组合文件区域和再提取文件区域的结果的示例的示意图;图13是描述根据第一实施例的在从输入文件图像数据到从文件图像数据提取文件区域的处理的流程图;图14是描述根据第一实施例的区域提取单元执行的文件图像数据提取处理的步骤的流程图;图15是描述根据第一实施例的日文垂直书写校正单元执行的文件区域再提取处理的步骤的流程图;图16A是描述根据第一实施例的日文垂本文档来自技高网...
【技术保护点】
一种图像处理装置,其包括:第一区域提取单元,用于通过将文件图像数据划分为文件区域单元,从文件图像数据中提取第一文件区域;语言确定单元,用于确定文件图像数据中使用的语言的类型;和第二区域提取单元,基于对应于语言确定单元 确定的语言类型的规则,通过划分或组合第一文件区域提取第二文件区域。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:西田广文,
申请(专利权)人:株式会社理光,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。