基于万维网的图像内容的检测、提取以及识别制造技术

技术编号:3900710 阅读:418 留言:0更新日期:2012-04-11 18:40
一种基于万维网的文本检测系统,包括:采集装置,其连接至客户终端,用于采集图像;浏览器插件,其在所述客户终端对所述被采集的图像进行分析,并且,根据所述分析,检测所述被采集的图像内的文本,在所述客户终端确定用于检索的文本图像特征;桌面检索应用程序界面,其将所述文本图像特征作为关键词,执行桌面检索。

【技术实现步骤摘要】

本专利技术涉及一种图像内容的检测(detection)、提取(extraction) 以及识别(recognition)技术。特别地,本专利技术涉及一种使用万维网 浏览器插件(web browser plug-in)来进行图像内容的检测、图像帧 的提取以及图像内容的识别的系统和方法。
技术介绍
计算机和电子文档仅限于在电子文档被计算机控制并且被计算机 输出至打印机并被打印在纸件上的环境中使用。电子文档一旦被打印 在纸件上,则该文档的纸件版和电子版的操作就各自独立。另外,目 前,打印和复印技术还不能把静态打印媒介(例如,纸件媒介)和动 态电子媒介连接起来;这里,动态电子媒介包括数字通信、网络、电 子信息传播、电子广告、在线娱乐以及电子商务等。在过去的几年中,个人数字助理(PDA)装置、手机(例如,相机 手机)、数码相机等的便携式计算装置和个人用电子装置的出现和普 及已经拓展了文档的概念,目卩通过将文档制作成可供电子阅读和检 索的形式,并且通过引进互动多媒体的功能,使文档还包含其电子版, 这是现有技术中的打印媒介所无法比拟的。但是,在连接电子文档和纸件文档的现有技术中存在一个问题, 即使用打印文档来访问或检索用于生成纸件文档的电子文档仍然非常困难和/或非常耗时。识别和检索与打印文档对应的电子文档的主 要障碍是打印文档向电子形式的转换,该电子形式被用来对打印文档 和电子文档进行比较。由于相机手机和扫描仪的激增,已经可以非常 容易地获取打印文档的图像,但是也还没有办法使用这些劣质图像对电子文档进行检索。另外,即使图像的质量很好,用于识别的计算量 也很大,并且计算结果的精度也不高。现有技术中还存在着一个问题,即在运行之前,几乎没有几个 类型的识别处理不需要专用的识别/通信软件安装至客户终端。另外,现有技术中还存在着一个问题,即没有办法通过使用纸 件和日常计算装置(例如,计算机等)的结合来有效地与电子文档进 行接口。目前,尽管已经有很多种方法可以实现与电子文档的接口, 例如工具条、按钮以及其他界面等,它们即可以单独地显示在计算机 屏幕上,也可以与鼠标控制器和键盘等的输入装置一起来使用,但是, 还没有一种接口可以与纸件(或其他有形媒介)和电子文档同时进行 操作。
技术实现思路
本专利技术是鉴于上述问题而提出的,其目的在于,提供一种通过使 用万维网浏览器插件来实现基于万维网的图像内容检测和图像提取的 系统。该系统的优点在于,可以在用户终端进行初期图像处理,以此来 确定图像是否适于识别处理以及是否适于提取用作处理的视频帧。用 户终端的图像处理最好通过万维网浏览器插件(以下简称"插件") 或者其他不需要安装至客户终端的小程序来实现。需要说明的是,这 里所说的"安装"是指将插件或其他小程序保存在永久存储装置中、以及/或者、对注册表(registry)进行修改。在一个实施例中,插件执行用于进行检测和提取视频帧的初期图 像分析,并且为服务器预留计算强化(compute-intense)的识别处理。 在一个实施例中,本专利技术的系统包括图像采集装置、万维网浏览器 (以下简称"浏览器")、插件以及识别服务器。插件还包括图像采集控制模块、分析模块以及传送模块;该传送模块用于将数据传送至识别服务器。插件对采集到的图像进行处理,以确定该图像是否包含 预定的内容,例如,图像是否为文档文本。然后,系统通过图像采集 装置和浏览器让用户能够将文档或其他类型的图像连接至电子数据。本专利技术还包括基于万维网的图像内容类型的检测方法。当插件的 初期图像处理检测到图像中的预定内容之后,该图像就被传送至识别 服务器进行内容识别。例如,如果初期图像处理确定了图像包含文档 文本,该图像就被传送至识别服务器进行文档识别。文档识别可以与 档案服务器或本地存储器(例如,客户终端的硬盘等)等各种文档资 源一起来使用。另外,在任何可上网的客户终端上,用户可以不需要 安装任何软件就能进行文档识别。运行时,还可以基于客户终端的参 数对插件进行修改。在服务器一侧,可以容易地与档案服务器等进行 整合,并且还可以容易地进行质量保证和软件升级。附图概述图1是本专利技术的一个实施例中的、基于万维网的图像内容检测和图 像提取的系统的示意图。图2是本专利技术的一个实施例中的、客户终端或识别服务器的功能框图。图3A是本专利技术的一个实施例中的、客户终端的存储单元的框图。 图3B是本专利技术的一个实施例中的、万维网服务器的存储单元的框图。图3C是本专利技术的一个实施例中的、识别服务器的存储单元的框图。 图4是本专利技术的一个实施例中的、浏览器和插件的框图。 图5A—5D是本专利技术的一个实施例中的、采集模块、检测模块、特 征提取模块以及检索模块的各种配置的框图。图6是本专利技术的一个实施例中的、基于万维网的内容类型检测方法 的流程图。图7是本专利技术的一个实施例中的、基于万维网的内容类型检测方法的互动示意图。图8是本专利技术的一个实施例中的、由检测模块所执行的基于万维网 的文本检测方法的流程图。图9是基于图8所示方法进行边缘检测的源程序图。图1 OA是本专利技术的一个实施例中的、由内容类型检测方法所生成的 用户界面的示意图。图10B是本专利技术的一个实施例中的、当匹配文档被找到时的用户界 面的示意图。图1 l是本专利技术的一个实施例中的、显示从档案服务器接收到的信 息的用户界面的示意图。图12是本专利技术的一个实施例中的、基于万维网的博客文本检测系 统和方法的功能图。图13是本专利技术的一个实施例中的、由基于万维网的博客文本检测 方法所生成的用户界面的示意图。图14是本专利技术的一个实施例中的、由与检索系统相连的图像文本 检测方法所生成的用户界面的示意图。图15是本专利技术的一个实施例中的、与检索系统相连的基于万维网 的图像文本检测系统和方法的功能图。图16是本专利技术的一个实施例中的、由图像文本检测方法所生成的 用户界面的示意图。图17A是本专利技术的一个实施例中的、由图像内容类型检测方法所生 成的用户界面的示意图。图17B是本专利技术的一个实施例中的、与QR码相 的视频被找到时的图17A的用户界面的示意图。具体实施方式以下参考附图说明本专利技术的最佳实施方式。本专利技术提供一种使用插件来实现基于万维网的图像内容类型检测 和图像提取的系统。为了详细地描述该系统,以下给出了几个具体的 实施例,但是,本专利技术并不局限于这些具体实施例,只要不脱离本发 明的基本思想,也可以采用其他变化形式来代替。例如,在下述记载 中,本专利技术是以文本识别为对象进行描述的,但是,本专利技术也适用于 其他类型的识别,例如,指纹识别、人物面部识别以及条形码识别等。另外,需要说明的是,本文中使用的"处理"、"计算"、"确 定"或"显示"等术语是指计算机系统或其他类似电子装置的动作或 处理,这些动作或处理由计算机程序来实现。执行这些动作或处理的 计算机程序可存储在计算机可读存储介质中,例如,可存储在软盘、光盘、CD-R0M、磁光盘、R0M、 RAM、 EPR0M、 EEPR0M、磁卡、光卡或其 他适于存储的电子装置中,这些存储介质通过总线与计算机系统相连。 参考图l。图l是本专利技术的一个实施例中的、基于万维网的图像内 容类型的检测系统100的示意图。如图1所示,参考由图像采集装置104所获得的内容(content) 102 本文档来自技高网
...

【技术保护点】
一种基于万维网的文本检测方法,包括: 图像采集步骤,由与客户终端相连的采集装置采集图像; 图像分析步骤,在所述客户终端对所述被采集的图像进行分析,以检测所述被采集的图像内的文本; 文本图像特征确定步骤,根据检测到的所述被采 集的图像内的文本,在所述客户终端确定用于检索的文本图像特征; 文本图像特征传送步骤,从所述客户终端传送所述文本图像特征,以对档案服务器进行检索。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:伯纳埃罗尔乔纳森J赫尔
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1