一种图像文字识别方法和装置制造方法及图纸

技术编号:8161773 阅读:283 留言:0更新日期:2013-01-07 19:39
本发明专利技术提供了一种图像文字识别的方法和装置,其中方法包括:S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询知识库获得识别结果对应的知识信息;S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。本发明专利技术使得用户在获取图像中文字识别结果的同时,能够获取到对应的知识信息,而无需进一步通过手工的方式获得知识信息,显然更加方便和省力。

【技术实现步骤摘要】
一种图像文字识别方法和装置
本专利技术涉及计算机应用
,特别涉及一种图像文字识别的方法和装置。
技术介绍
随着移动互联网的迅速发展,基于移动终端摄像头采集到的图像的应用越来越广泛。其中图像文字识别技术将图像中的文字进行识别,转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息。在实际应用过程中存在如下情况,用户通过移动终端拍摄的图像中,有很多是用户不认识或者用户了解的文字,例如一些生僻字 、诗词等,这种情况下,用户除了想提取这些文字内容之外还想进一步了解文字的知识信息,现有图像文字识别技术则无法解决该问题,用户需要通过手工方式进行进一步查询,例如查询字典或者手工输入搜索引擎中进行查询。
技术实现思路
有鉴于此,本专利技术提供了一种图像文字识别方法和装置,以便于方便用户获取图像文字的知识信息。具体技术方案如下一种图像文字识别的方法,该方法包括SI、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询知识库获得识别结果对应的知识信息;S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。根据本专利技术一优选实施例,所述步骤SI具体包括服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,服务器接收移动终端从待识别图像中提取并发送来的文字区域。根据本专利技术一优选实施例,所述步骤S2具体包括对文字区域进行二值化;对二值化后的文字区域分割为各字块;提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。根据本专利技术一优选实施例,所述步骤S3具体包括以下中的一种或任意组合查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;查询文化知识库获得文字对应的典故或出处信息;查询书籍查询库获得文字对应的书籍信息或网络资源信息;查询商品查询库获得文字对应的商品信息;查询音乐查询库获得文字对应的音乐信息或网络资源信息;查询网络应用搜索库获得文字对应的网络应用信息或网络入口。根据本专利技术一优选实施例,在所述步骤S3中查询所有知识库,将获得的所有知识信息生成知识拓展词包;或者,在所述步骤SI中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述个性化选项内容对应的知识库,将获得的知识信息生成知识拓展词包;或者,在所述步骤S3中查询所有知识库,对查询到的 知识信息进一步确定知识信息对应的权重,将权重值排在前N个的知识信息生成知识拓展词包,N为预设的正整数。根据本专利技术一优选实施例,所述知识信息对应的权重采用以下方式确定根据知识信息被查询到的总次数确定该知识信息对应的权重,总次数越大权重值越大;或者, 利用知识信息被查询到的总次数确定该知识信息对应的知识权重,利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重,利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。一种图像文字识别的装置,该装置包括区域获取单元,用于获取待识别图像中的文字区域;文字识别单元,用于对所述文字区域进行文字识别;知识查询单元,用于所述文字识别单元的识别结果查询知识库获得识别结果对应的知识信息;结果推送单元,用于在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。根据本专利技术一优选实施例,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。根据本专利技术一优选实施例,所述文字识别单元具体执行对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。根据本专利技术一优选实施例,所述知识查询单元具体执行以下中的一种或任意组合查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;查询文化知识库获得文字对应的典故或出处信息;查询书籍查询库获得文字对应的书籍信息或网络资源信息;查询商品查询库获得文字对应的商品信息;查询音乐查询库获得文字对应的音乐信息或网络资源信息;查询网络应用搜索库获得文字对应的网络应用信息或网络入口。根据本专利技术一优选实施例,所述知识查询单元查询所有知识库,将获得的所有知识信息生成知识拓展词包;或者,所述区域获取单元还用于获取用户选择的个性化选项内容,所述知识查询单元查询所述个性化选项内容对应的知识库,将获得的知识信息生成知识拓展词包;或者,所述知识查询单元查询所有知识库,对查询到的知识信息进一步确定知识信息对应的权重,将权重值排在前N个的知识信息生成知识拓展词包,N为预设的正整数。根据本专利技术一优选实施例,所述知识查询单元采用以下方式确定所述知识信息对应的权重根据知识信息被查询到的总次数确定该知识信息对应的权重,总次数越大权重值越大;或者, 利用知识信息被查询到的总次数确定该知 识信息对应的知识权重,利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重,利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。由以上技术方案可以看出,本专利技术利用文字识别的结果查询知识库获得识别结果对应的知识信息,并包含在知识拓展词包中连同识别结果一起返回给用户,使得用户在获取图像中文字识别结果的同时,能够获取到对应的知识信息,而无需进一步通过手工的方式获得知识信息,显然更加方便和省力。附图说明图I为本专利技术实施例一提供的图像文字识别的方法流程图;图2为本专利技术实施例提供的系统示意图;图3为本专利技术实施例二提供的图像文字识别的装置结构图;图4和图5为本专利技术实施例提供的移动终端的两个展示效果示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。实施例一、图I为本专利技术实施例提供的图像文字识别的方法流程图,如图I所示,该方法可以包括以下步骤步骤101 :获取待识别图像中的文字区域。服务器获取移动终端发送来的包含文字信息的图像,该图像可以是移动终端拍摄到的原始图像,服务器在本步骤中提取待识别图像中的文字区域。或者,该图像可以是移动终端拍摄到原始图像后,提取出待识别图像中的文字区域后将待识别图像中的文字区域发送给服务器。在提取文字区域时可以采用现有的方式,去除图像背景后提取文字区域,可以采用但不限于以下方式方式一、首先根据彩色欧式距离进行彩色游程编码,然后进行颜色聚类,基于聚类结果进行文字层的生成和选择,例如保留面积大于一定值的连通域,基于连通域与各颜色聚类中心的欧式距离生成各图像层面,最后依据各图像层面的像素个数与该层分割阈值的像素个数的关系确定文字层面、噪声层面或背景层面,最后取出噪声层面和背景层面后就得到文字层面,即文字区域。方式二、选择大量的文字样本图像和不含文字的图片,使用canny算子提取这两类图片的边缘信息作为稀疏表示分类字典的训练样本;将两类训练样本输入分类稀疏表示字典训练算法得到文字稀疏表示分类字典和非文字稀疏表示分类字典;将待识别图像转为灰度图像,使用canny算子提取灰度图像的边缘信息;利用基于分类字典的稀疏表示提取灰度图像边缘信息中本文档来自技高网...

【技术保护点】
一种图像文字识别的方法,其特征在于,该方法包括:S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询知识库获得识别结果对应的知识信息;S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。

【技术特征摘要】

【专利技术属性】
技术研发人员:韩钧宇丁二锐吴中勤文林福
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1