信息处理方法和装置制造方法及图纸

技术编号:2890705 阅读:218 留言:0更新日期:2012-04-11 18:40
当从对一幅输入图像的字符识别中获得的结果被用作搜索操作的文本数据时,一种适当的搜索操作可被执行,即使在字符识别处理中由于字符抽取错误,一个不同于实际字符图像的字符被存储为文本数据。一种信息处理装置包括:一个输入图像信息的图像扫描仪;识别输入图象的OCR软件;存储识别结果的文本信息存储部分;以及假设在一个指字的搜索字中添加额外字符的文档搜索软件。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种信息处理方法和装置,它能搜索图像或包含一个指定搜索字的文本信息。能够搜索一幅图像,并用由OCR或类似装置识别的输入图像创建一个数据库的装置是常规可以获得的。在这种用于搜索图像并创建数据库的装置中,让用户确认识别结果的步骤传统上是在登记之前,以克服在用OCR识别图像的处理过程中由于误识别引起的搜索不完整。在该确认步骤中,包括一串字符、直到与识别结果具有较低的相似性为止的候选字符提供给用户。用户选取一个正确的字符,或者在没有正确字符包含在候选字符中时输入一个正确字符。因此,一段由用户登记的文本就被用户手工修正了,然后修正过的文本被登记。取代用户手工进行这种修正操作,一种使用字典或知识库、机械地修正文本的技术可以获得。在需要用户手工修正操作的现有技术中,用户的负担很重,在每个登记操作中都需要一段长时间的麻烦的操作。这种修正操作干扰了全自动修正。在用字典或知识库机械修正文本的技术中,若不使用具有高计算能力的计算机,就无法实现全自动修正的实际应用。另外,自动修正的可靠性仍然是个问题。在限制对应一个输入字符图像的识别结果为一个字符的修正步骤中若发生误修正,则被修正的字符无本文档来自技高网...

【技术保护点】
一种确定一个指定字符队列是否包括在文本信息中的信息处理方法,包含步骤:形成一个模式,其中至少一个字符被指定的字符队列删除;以及使用所形成的模式执行确定。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:椎山弘隆
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1