信息处理设备和信息处理方法技术

技术编号:8533412 阅读:167 留言:0更新日期:2013-04-04 16:45
本发明专利技术提供了一种信息处理设备和信息处理方法,该信息处理设备包括鉴别单元、字符识别单元、获取单元、校正单元和输出单元。鉴别单元鉴别包括在运动图像中的静止图像。字符识别单元对通过鉴别单元鉴别的静止图像执行字符识别。获取单元获取关于运动图像的信息。基于通过获取单元获取的信息,校正单元校正通过字符识别单元生成的字符识别结果。输出单元输出与运动图像相关联的通过校正单元校正的字符识别结果。

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
可以获得用于特征识别的技木。作为与这种技术相关的技术,例如,日本未审查专利申请公开第2001-285716号公开了能够以高精度检测和识别图像中的字幕(telop)的字幕信息处理设备。在字幕信息处理设备中,从图像中检测出显示字幕信息的区域,提取组成字幕字符的像素,以及通过使用字幕候选图像创建单元、字幕字符串区域候选提取単元、字幕字符像素提取单元和字幕字符识别単元,在字符识别处理中执行识别。字幕信息创建单元基于这一系列处理的可靠性评估结果来选择为ー个字幕提供的多个识别结果之一。此吋,字幕信息创建单元通过使用由字幕字符像素提取单元执行的字幕字符提取处理的可靠性评估值和/或由字幕字符识别单元执行的字符识别处理的识别可靠性来获取最終的字幕信息。日本未审查专利申请公开第04-115384号公开了具有单词检查功能的日单词符识别设备,其中,如果在字典中登记有已经读取的字符串,则该字符串被确定为字,并且通过使用描述语句中的词性之间的连接关系的连接表确保字之间的有效性来根据上下文识别字符,从而提高字符读取性能。日单词符识别设备包括读取单元,其读取日单词符并提取用于模糊字符的多个可能性高的候选;字符串创建単元,如果在通过读取单元读取的字符串中存在模糊字符,其通过组合多个可能性高的候选来创建候选字符串;单词划分単元,其对通过字符串创建単元所创建的字符串执行单词划分;字典中查找单元,其确定在字典中是否已登记有通过单词划分单元执行的单词划分所获取的字;以及连接关系确定单元,其參照描述词性间连接关系的连接表,确定已被字典中查找单元确定登记在字典中的单词的连接关系。
技术实现思路
本专利技术的目的在于提供,其中,与不使用根据本专利技术示例性实施例的结构的情况相比,可以使用针对运动图像中的图像的具有较高识别精度的字符识别結果。根据本专利技术的第一方面,提供了ー种信息处理设备,包括鉴别单元、字符识别单元、获取单元、校正単元和输出单元。鉴别单元鉴别包括在运动图像中的静止图像。字符识别单元对通过鉴别单元鉴别的静止图像执行字符识别。获取单元获取关于运动图像的信息。校正単元基于通过获取单元所获取的信息校正通过字符识别单元生成的字符识别结果。输出单元输出与运动图像相关联的通过校正単元校正的字符识别結果。根据本专利技术的第二方面,获取单元识别运动图像中的人物并获取关于人物的信息。校正単元基于通过获取单元获取的关于人物的信息校正字符识别結果。根据本专利技术的第三方面,基于作为用于识别运动图像的信息的运动图像识别信息或者基于运动图像识别信息和通过鉴别単元鉴别的静止图像的时间位置,获取单元获取可能包括在静止图像中的字符信息。校正単元基于通过获取单元获取的字符信息校正字符识别結果。根据本专利技术的第四方面,获取单元提取通过字符识别单元对处于预定时间位置的静止图像生成的字符识别结果中所包括的人物的名字,并获取关于人物的名字的信息。基于通过获取单元获取的关于人物的名字的信息,校正単元校正通过字符识别单元所生成的字符识别結果。根据本专利技术的第五方面,获取单元提取关于运动图像的拍摄地点以及拍摄日期和时间的信息,并获取关于在拍摄日期和时间在拍摄地点举行的事件的信息。基于通过获取单元获取的关于事件的信息,校正単元校正通过字符识别单元生成的字符识别結果。根据本专利技术的第六方面,获取单元对通过字符识别単元生成的字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息。基于通过获取单元获取的关于字符串的信息,校正単元校正通过字符识别单元生成的字符识别結果。根据本专利技术的第七方面,获取单元提取包括在由字符识别単元生成的字符识别结果中的人物的名字或者事件标题,并且,如果字符识别结果包括多个人物的名字或多个事件标题,则获取単元基于静止图像的时间位置执行加权并获取使用加权结果而选择的关于人物的名字或事件标题的信息。基于通过获取单元获取的关于人物的名字或事件标题的信息,校正単元校正通过字符识别单元生成的字符识别結果。根据本专利技术的第八方面,提供了ー种图像处理方法,包括鉴别运动图像中包括的静止图像;对鉴别的静止图像执行字符识别;获取关于运动图像的信息;基于获取的信息,校正在字符识别中生成的字符识别結果;以及输出与运动图像相关联的校正字符识别结果。在根据本专利技术第一方面的信息处理设备中,与不使用根据本专利技术示例性实施例的结构的情况相比,可以使用针对运动图像中的图像具有较高识别精度的字符识别結果。在根据第二方面的信息处理设备中,可以基于关于运动图像中的人物的信息来校正字符识别結果。在根据第三方面的信息处理设备中,可以基于运动图像鉴别信息和关于静止图像的时间位置的信息来校正字符识别結果。在根据第四方面的信息处理设备中,可以基于关于人物的名字的信息来校正字符识别結果。在根据第五方面的信息处理设备中,可以基于关于在运动图像的拍摄日期和时间在拍摄地点举行的事件的信息来校正字符识别結果。在根据第六方面的信息处理设备中,可以基于关于用作对字符识别结果执行的形态分析结果的字符串的信息或者与该字符串类似的字符串的信息来校正字符识别結果。在根据第七方面的信息处理设备中,可以基于根据静止图像的时间位置已执行了加权的关于人物的名字或事件标题的信息来校正字符识别結果。在根据第八方面的信息处理方法中,与不使用根据本专利技术示例性实施例的结构的情况相比,可以使用针对运动图像中的图像具有较高识别精度的字符识别結果。附图说明将基于以下附图描述本专利技术的示例性实施例,其中图1是示出根据示例性实施例的示例结构的概念模块结构示图;图2是示出根据示例性实施例的示例结构的概念模块结构示图;图3是示出根据示例性实施例的示例结构的概念模块结构示图;图4是示出根据示例性实施例的通过人物识别模块等执行的处理的示例的流程图;图5是示出运动图像、幻灯图像(slide image)和面部区域的示例的示图;图6是示出人物关键字组表的数据结构的示例的示图;图7是示出根据示例性实施例的通过运动图像ID/页码识别模块执行的处理的示例的流程图;图8是示出运动图像ID/页码关键字组表的数据结构的示例的示图;图9是示出根据示例性实施例的通过演讲者名字识别模块等执行的处理的示例的流程图;图10是示出演讲者名字关键字组表的数据结构的示例的示图;图11是示出根据示例性实施例的通过演讲标题指定模块等执行的处理的示例的流程图;图12是示出时间表的数据结构的示例的示图;图13是示出演讲标题关键字组表的数据结构的示例的示图;图14是示出运动图像和幻灯图像的示例的示图;图15是示出根据示例性实施例的通过文本组配置模块等执行的处理的示例的流程图;图16是示出运动图像和幻灯图像的示例的示图;图17是示出文本组关键字组表的数据结构的示图;图18是示出根据示例性实施例的通过人物名字提取模块、演讲标题提取模块等执行的处理的示例的流程图;图19是示出运动图像和幻灯图像的示例的示图;图20是示出人物名字/演讲标题关键字组表的数据结构的示例的示图;图21是示出运动图像和幻灯图像的示例的示图;图22是示出在实现示例性实施例的情况下的示例系统结构的示图;以及图23是示出实现示例性实施例的计算机的示例硬件结构的框图。具体实施例方式以下,參照附图描述本专利技术的本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201210102344.html" title="信息处理设备和信息处理方法原文来自X技术">信息处理设备和信息处理方法</a>

【技术保护点】
一种信息处理设备,包括:鉴别单元,其鉴别包括在运动图像中的静止图像;字符识别单元,其对通过所述鉴别单元鉴别的所述静止图像执行字符识别;获取单元,其获取关于所述运动图像的信息;校正单元,其基于通过所述获取单元所获取的信息,校正通过所述字符识别单元生成的字符识别结果;以及输出单元,其输出与所述运动图像相关联的通过所述校正单元校正的字符识别结果。

【技术特征摘要】
2011.09.21 JP 2011-2056151.一种信息处理设备,包括 鉴别单元,其鉴别包括在运动图像中的静止图像; 字符识别单元,其对通过所述鉴别单元鉴别的所述静止图像执行字符识别; 获取单元,其获取关于所述运动图像的信息; 校正单元,其基于通过所述获取单元所获取的信息,校正通过所述字符识别单元生成的字符识别结果;以及 输出单元,其输出与所述运动图像相关联的通过所述校正单元校正的字符识别结果。2.根据权利要求1所述的信息处理设备, 其中,所述获取单元识别所述运动图像中的人物并获取关于所述人物的信息,并且其中,所述校正单元基于通过所述获取单元所获取的关于所述人物的信息来校正所述字符识别结果。3.根据权利要求1所述的信息处理设备, 其中,基于作为用于鉴别所述运动图像的信息的运动图像鉴别信息或者基于所述运动图像鉴别信息和通过所述鉴别单元所鉴别的静止图像的时间位置,所述获取单元获取可能包括在所述静止图像中的字符信息,并且 其中,所述校正单元基于通过所述获取单元所获取的字符信息来校正所述字符识别结果O4.根据权利要求2所述的信息处理设备, 其中,基于作为用于鉴别所述运动图像的信息的运动图像鉴别信息或者基于所述运动图像鉴别信息和通过所述鉴别单元所鉴别的静止图像的时间位置,所述获取单元获取可能包括在所述静止图像中的字符信息,并且 其中,所述校正单元基于通过所述获取单元所获取的字符信息来校正所述字符识别结果O5.根据权利要求1至4中任一项所述的信息处理设备, 其中,所述获取单元提取通过所述字符识别单元针对处于预定时间位置的静止图像生成的字符识别结果中所包括的人物名字,并获取关于所述人物名字的信息,并且 其中,基于通过所述获取单元所获取的关于所述人物名字的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。6.根据权利要求1至4中任一项所述的信息处理设备, 其中,所述获取单元提取关于所述运动图像的拍摄地点以及拍摄时间和日期的信息,并获取关于在所述拍摄日期和时间在所述拍摄地点举行的事件的信息,并且 其中,基于通过所述获取单元所获取的关于所述事件的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。7.根据权利要求5所述的信息处理设备, 其中,所述获取单元提取关于所述运动图像的拍摄地点以及拍摄时间和日期的信息,并获取关于在所述拍摄日期和时间在所述拍摄地点举行的事件的信息,并且 其中,基于通过所述获取单元所获取的关于所述事件的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。8.根据权利要求1至4中任一项所述的信息处理设备,其中,所述获取单元对通过所述字符识别单元生成的所述字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息,并且 其中,基于通过所述获取单元所获取的关于字符串的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。9.根据权利要求5所述的信息处理设备, 其中,所述获取单元对通过所述字符识别单元生成的所述字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息,并且 其中,基于通过所述获取单元所获取的关于字符串的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。10.根据权利要求6所述的信息处理设备, 其中,所述获取单元对通过所述字符识别单元生成的所述字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息,并且 其中,基于通过所述获取单元所获取的关于字符串的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。11.根据权利要求7所述的信息处理设备, 其中,所述获取单元对通过所述字符识别单元生成的所述字符识别结果执行形态分析,并获取关于作为形态分析结果的字符串的信息或者关于与该字符串类似的字符串的信息,并且 其中,基于通过所述获取单元所获取的关于字符串的信息,所述校正单元校正通过所述字符识别单元所生成的字符识别结果。12.根据权利要求1至4中任一项所述的信息处理设备, 其中,所述获取单元提取通过所述字符识别单元所生成的字符...

【专利技术属性】
技术研发人员:永峰猛志安部勉
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1