图像处理装置,图像处理方法制造方法及图纸

技术编号：2928875 阅读：254 留言：0更新日期：2012-04-11 18:40

第一区域提取单元通过将文件图像数据划分为文件区域单元而从文件图像数据中提取第一文件区域。语言确定单元确定文件图像数据中使用的语言的类型。第二区域提取单元基于对应于语言确定单元确定的语言类型的规则，通过划分或组合第一文件区域提取第二文件区域。

全部详细技术资料下载

【技术实现步骤摘要】
,图像处理方法和计算机程序产品的制作方法
本专利技术涉及从图像数据中提取包括字符的区域的技术。
技术介绍
本专利技术包括并引用了于2005年10月7日申请的日本优先权文件第2005-295412的全部内容。通常，将由例如扫描仪和数码相机的图像输入装置输入到计算机中的文件图像分类为文件组成元素的过程，即分类为字符块、照片/图片/插图、表格和划线的过程称为“几何布局分析”或“页面分割”。通常对二进制文件图像进行“几何布局分析”或“页面分割”。此外，“几何布局分析”或“页面分割”和如预处理的“倾斜(skew)校正”相关，在“倾斜校正”过程中，校正输入时导致的倾斜。已经进行过倾斜校正的二进制文件图像的“几何布局分析”或“页面分割”分为两大类方法(由上而下的分析和由下而上的分析)。下面解释由上而下的分析。由上而下的分析将页面分解为大的组成元素，然后再分解为较小的组成元素。这种方法中，将较大的组成成份分解为较小的成份；例如，将页面分解为列，将每列分解为段，将每段分解为字符行。由上而下的分析通过使用基于页面布局结构(例如，Manhattan布局中的字符行是竖式的矩形)假设的模型，而对简便计算是是有利的。然而如果假设对于数据无效，存在一缺点即会产生致命错误。对于复杂的布局，在大多数情况下建模也会变得复杂，因此不容易处理复杂布局。接下来介绍由下而上的分析。在由下而上的分析中，如日本专利申请第2000-067158号和日本专利第3187895号中描述的那样，通过参考和相邻元素的位置关系来整合组成元素。这种方法中，将较小的组成元素分组到较大的元素下；例如，将相连的元素放成一行...

【技术保护点】
一种图像处理装置，其包括：第一区域提取单元，用于通过将文件图像数据划分为文件区域单元，从文件图像数据中提取第一文件区域；语言确定单元，用于确定文件图像数据中使用的语言的类型；和第二区域提取单元，基于对应于语言确定单元确定的语言类型的规则，通过划分或组合第一文件区域提取第二文件区域。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：西田广文，
申请(专利权)人：株式会社理光，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人