基于万维网的图像内容的检测、提取以及识别制造技术

技术编号：3900710 阅读：418 留言：0更新日期：2012-04-11 18:40

一种基于万维网的文本检测系统，包括：采集装置，其连接至客户终端，用于采集图像；浏览器插件，其在所述客户终端对所述被采集的图像进行分析，并且，根据所述分析，检测所述被采集的图像内的文本，在所述客户终端确定用于检索的文本图像特征；桌面检索应用程序界面，其将所述文本图像特征作为关键词，执行桌面检索。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种图像内容的检测(detection)、提取(extraction) 以及识别(recognition)技术。特别地，本专利技术涉及一种使用万维网浏览器插件(web browser plug-in)来进行图像内容的检测、图像帧的提取以及图像内容的识别的系统和方法。
技术介绍
计算机和电子文档仅限于在电子文档被计算机控制并且被计算机输出至打印机并被打印在纸件上的环境中使用。电子文档一旦被打印在纸件上，则该文档的纸件版和电子版的操作就各自独立。另外，目前，打印和复印技术还不能把静态打印媒介(例如，纸件媒介)和动态电子媒介连接起来；这里，动态电子媒介包括数字通信、网络、电子信息传播、电子广告、在线娱乐以及电子商务等。在过去的几年中，个人数字助理(PDA)装置、手机(例如，相机手机)、数码相机等的便携式计算装置和个人用电子装置的出现和普及已经拓展了文档的概念，目卩通过将文档制作成可供电子阅读和检索的形式，并且通过引进互动多媒体的功能，使文档还包含其电子版，这是现有技术中的打印媒介所无法比拟的。但是，在连接电子文档和纸件文档的现有技术中存在一个问题，即使用打印文档来访问或检索用于生成纸件文档的电子文档仍然非常困难和/或非常耗时。识别和检索与打印文档对应的电子文档的主要障碍是打印文档向电子形式的转换，该电子形式被用来对打印文档和电子文档进行比较。由于相机手机和扫描仪的激增，已经可以非常容易地获取打印文档的图像，但是也还没有办法使用这些劣质图像对电子文档进行检索。另外，即使图像的质量很好，用于识别的计算量也很大，并且计算...

【技术保护点】
一种基于万维网的文本检测方法，包括：　图像采集步骤，由与客户终端相连的采集装置采集图像；　图像分析步骤，在所述客户终端对所述被采集的图像进行分析，以检测所述被采集的图像内的文本；　文本图像特征确定步骤，根据检测到的所述被采集的图像内的文本，在所述客户终端确定用于检索的文本图像特征；　文本图像特征传送步骤，从所述客户终端传送所述文本图像特征，以对档案服务器进行检索。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：伯纳埃罗尔，乔纳森J赫尔，
申请(专利权)人：株式会社理光，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人