编码设备、数据检索与图像处理设备及系统,及其方法技术方案

技术编号:3584095 阅读:246 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了编码设备、数据检索设备、图像处理设备、数据检索系统、图像处理系统、编码方法、数据检索方法以及图像处理方法。在该编码设备中,提取单元从图像数据中提取数字串数据。基于聚焦元素与相邻该聚焦元素的元素之间的关联,对数字串数据的聚焦元素分配代码,代码串数据生成单元生成代码串数据。控制单元在存储单元中以关联的方式存储数字串数据和作为注册信息的代码串数据。使用代码串数据作为检索信息,检索单元在存储单元检索具有匹配检索信息的注册信息的数据。

【技术实现步骤摘要】

本专利技术涉及对输入数据进行编码并基于编码的数据对数据进行检索的技术。
技术介绍
在接收例如图像文件等数据时,数据检索设备对输入数据进行编码,并以 相关方式将输入数据和编码数据存储在该检索设备中。当检索存储的数据时, 数据检索设备对想要的数据指定的标题和/或关键字之一或二者进行编码,并 据此,检索并输出想要的数据。例如,日本专利申请公开No.H9-270902揭示了 一种传统的技术,该技术 将从资料文件读取的图像数据作为图像文件存储到存储器中,并从存储的图像 文件中检索想要的图像文件。具体地讲,从图像数据中检索文本区域中的字符 矩形的宽度和高度的比率作为资料文件属性。基于阈值对该比率进行编码,并 将获取的代码写入每一个矩形。以与将要用于检索图像文件的图像文件相关的 方式,作为注册关^t建字信息来管理代码。已经提出了另一种传统的技术,其中,生成^:影直方图作为在图像数据中 包括的文本区域的属性。使投影直方图标准化,然后基于在标准化的投影直方 图中的每一个位置上的黑色像素的数量进行编码,并且以与将要用于检索图像 文件的图像文件相关的方式,管理编码的投影直方图。然而,根据前一种传统技术,在每一个检索的矩形上单独地计算字符矩形 的宽度和高度的比率,并且基于计算的比率将代码分配给每一个矩形。因此, 如果从以不同的纵才黄比放大或缩小的相同内容的多篇文本中检索矩形,则对多 篇文本中的字符分配不同的代码。因此,如果主要图像数据具有不同的纵横比(见图27),则不能基于为其分配的代码检索主要图像数据。根据后一种传统技术,基于与投影直方图中的每一个位置相应的黑色像素 的数量对投影直方图进行编码。如果仅仅水平地放大该图像数据,则黑色像素 的数量改变。作为结果,对具有相同内容的图像数据分配不同的代码。
技术实现思路
本专利技术的目的是至少部分地解决传统技术中的问题。根据本专利技术的一个方面, 一种编码设备包括获取单元,获取数字串数据; 以及生成单元,对数字串数据进行编码,基于聚焦元素与相邻近该聚焦元素的 元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串数据。根据本专利技术的另一个方面, 一种数据检索设备包括获取单元,获取数字 串数据;生成单元,对数字串数据进行编码,基于聚焦元素与邻近该聚焦元素 的元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串 数据;存储单元,以关联的方式存储作为注册信息的代码串数据以及数字串数 据;以及检索单元,基于注册信息检索数字串数据。根据本专利技术的又一个方面, 一种图像处理设备包括获取单元,获取图像 数据;提取单元,从图像数据中提取数字串数据;生成单元,对数字串数据进 行编码,基于聚焦元素与邻近该聚焦元素的元素之间的数值关系,通过对数字 串数据的聚焦元素分配代码来生成代码串数据;存储单元,以关联的方式存储 作为注册信息的代码串数据以及图像数据;以及检索单元,基于注册信息检索 图像数据。根据本专利技术的又一个方面, 一种数据检索系统包括信息处理器和经由网 络连接到信息处理器的服务器。该信息处理器包括获取单元,获取数字串数 据;以及生成单元,对数字串数据进行编码,基于聚焦元素与邻近该聚焦元素 的元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串 数据。该服务器包括存储单元,以关联的方式存储作为注册信息的代码串.数 据以及数字串数据;以及检索单元,基于注册信息检索数字串数据。根据本专利技术的又一个方面, 一种图像处理系统包括图像处理器和经由网 络连接到图像处理器的服务器。该图像处理器包括获取单元,获取图像数据;提取单元,从图像数据中提取数字串数据;生成单元,对数字串数据进行编码, 基于聚焦元素与邻近该聚焦元素的元素之间的数值关系,通过对数字串数据的 聚焦元素分配代码来生成代码串数据。该服务器包括存储单元,以关联的方 式存储作为注册信息的代码串数据以及图像数据;以及检索单元,基于注册信 息检索图像数据。根据本专利技术的又一个方面, 一种编码方法包括获取数字串数据;以及对根据本专利技术的又一个方面, 一种数据检索方法包括获取数字串数据;对系,通过对数字串数据的聚焦元素分配代码来生成代码串数据;以关联的方式 存储作为注册信息的代码串数据以及数字串数据;以及基于注册信息检索数字 串数据。根据本专利技术的又一个方面, 一种图像处理方法包括获取图像数据;从图 像数据中提取数字串数据;对数字串数据进行编码,基于聚焦元素与邻近该聚 焦元素的元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成 代码串数据;以关联的方式存储作为注册信息的代码串数据以及图像数据;以 及基于注册信息检索图像数据。当联系附图考虑时,通过阅读本专利技术的当前的优选实施例的下面的详细描 述,将更好的理解本专利技术的以上和其它的目的、特征、优点以及技术和产业上 的意义。 附图说明图1是根据本专利技术的第一实施例的应用图像处理设备的数字影印机的示 意图;图2是图1中所示的数字影印机的功能方框图; 图3是根据第一实施例的图像文件注册处理的流程图; 图4是根据第 一 实施例的图像文件检索处理的流程图; 图5是根据第一实施例的图像转换处理的流程图; 图6是图5中所示的区域提取处理的详细流程图;图7A、 7B、 8A、 8B和9是在图6中所示的区域提取处理的结果的示例; 图IO是图5中所示的图像属性提取处理的详细流程图; 图11是根据第一实施例的以读取的顺序划分的各自区域上的区域确定结 果的示例;图12是用于说明图5中所示的图像转换处理的示意图;图13是图10中所示的关键字信息生成处理的详细流程图;图14是图13中所示的编码处理的详细流程图;图15是用于说明图14中所示的编码处理的示意图;图16是用于对在图14中所示的编码处理中的聚焦元素分配代码的转换表;图17是根据本专利技术的第二实施例的属性提取处理的详细流程图; 图18是用于说明根据第二实施例的图像转换处理的示意图; 图19是根据第二实施例的水平计算的投影直方图和垂直计算的投影直方 图的示例;图20是用于说明根据第二实施例的资料图像及其投影直方图的示意图; 图21是使用移动平均数从图20中所示的投影直方图中产生的平滑的投影 直方图的示例;图22是从图21中所示的平滑的投影直方图中产生的量化的投影直方图的 示例;图23是使用不同移动平均宽度的移动平均数从图20中所示的投影直方图中产生的平滑的影直方图的另 一 个示例;图24A和24B是根据第二实施例的采样的投影直方图的示例;图25是图17中所示的关4定字信息产生处理的详细流程26是根据本专利技术的第三实施例的数据检索系统的硬件配置的功能方框图;及图27是根据传统技术的以不同的纵横比放大的图像数据的投影直方图的 示例。具体实施方式下面参4附图详细地说明本专利技术的示例性实施例。图1是根据本专利技术的第一实施例的数字影印机的示意图,将图像处理设备应用于该数字影印机。数字影印机包括图像读取单元100和图像形成单元200。 图像读取单元100例如扫描仪,包括设置在顶部的曝光玻璃(未示出)和 设置在曝光玻璃下面的光学扫描系统,在曝光玻璃上放置资料文件。将在曝光 玻璃上放置的资料文件暴露于光学扫描系统中的曝光灯1的光,并且当曝光时 反射的光,即图像光,通过在光学扫描本文档来自技高网
...

【技术保护点】
一种编码设备,包括:    获取单元,用于获取数字串数据;以及    生成单元,对该数字串数据进行编码,基于聚焦元素与相邻该聚焦元素的元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串数据。

【技术特征摘要】
JP 2007-1-31 2007-0221081.一种编码设备,包括获取单元,用于获取数字串数据;以及生成单元,对该数字串数据进行编码,基于聚焦元素与相邻该聚焦元素的元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串数据。2. —种数据检索设备,包括 获取单元,用于获取数字串数据;生成单元,对数字串数据进行编码,基于聚焦元素与相邻该聚焦元素的元 素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串数 据;存储单元,以关联的方式存储作为注册信息的代码串数据以及数字串数 据;以及检索单元,基于该注册信息检索该数字串数据。3. —种图像处理设备,包括 获取单元,用于获取图像数据;提取单元,用于从该图像数据中提取数字串数据;生成单元,对该数字串数据进行编码,基于聚焦元素与相邻该聚焦元素的 元素之间的数值关系,通过对数字串数据的聚焦元素分配代码来生成代码串数 据;存储单元,以关联的方式存储作为注册信息的代码串数据以及图像数据; 以及检索单元,基于该注册信息检索该图像数据。4. 根据权利要求3所述的图像处理设备,其特征在于所述提取单元从 所述图像数据的文本区域提取字符矩形,并计算该字符矩形的宽度和高度的比 率,以提取所述数字串数据。5. 根据权利要求4所述的图像处理设备,其特征在于所述提取单元合 并相邻的字符矩形以获得所述字符矩形。6. 根据权利要求5所述的图像处理设备,其特征在于在确定矩形的大 小落入预定的范围之内时,所述提取单元确定该矩形是字符矩形。7. 根据权利要求6所述的图像处理设备,其特征在于所述提取单元从 所述图像数据中提取字符行,并合并相邻的字符行以获得文本区域。8. 根据权利要求3所述的图像处理设备,其特征在于所述提取单元计 算在所述图像数据中的每一个区域的投影直方图,并从该投影直方图中提取数 字串数据。9. 根据权利要求8所述的图像处理设备,其特征在于所述提取单元计 算在文本区域中的每一行的文本区域的投影直方图。10. 根据权利要求3到9中的任一项权利要求所述的图像处理设备,其特 征在于所述4企索单元从作为来自该代码串数据的右端和左端中的任意一端的 检索关键字中获取多个元素,并检索具...

【专利技术属性】
技术研发人员:伊东秀夫大黑庆久徐盈辉
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1