文本信息识别方法及系统技术方案

技术编号：8300943 阅读：148 留言：0更新日期：2013-02-07 04:35

本发明专利技术涉及一种文本信息识别方法及系统，该方法包括如下步骤：客户端获取包含文本信息的图像，并将图像发送至云服务器；云服务器接收图像，对图像进行处理，提取出图像中文本信息的字符；对字符进行处理，获取字符的特征；根据字符的特征，查询设置在云服务器上特征库，与特征库中的字符进行特征匹配，对字符进行识别，进而识别文本信息；云服务器将识别的文本信息发送至客户端。本发明专利技术客户端将图像上传至云服务器，识别过程和云服务器均在云服务器上进行，云服务器具有强大的计算能力和扩展能力，性能能够满足特征库的要求，使得特征库和识别能力不受用户计算机的限制，从而能够准确的对文本信息进行识别，简单、高效、识别率大大提高。

全部详细技术资料下载

【技术实现步骤摘要】
文本信息识别方法及系统
本专利技术涉及一种信息处理技术，尤其涉及一种文本信息识别方法及系统。
技术介绍
目前，纸质文档或者图片上的文本信息，不能直接使用，在使用时需要手动输入才可。为替代手动输入，通常米用OCR (Optical Character Recognition光学字符识别)技术对文本信息进行识别。但是，传统的OCR技术，用户在使用时，需要安装一个庞大的客户端软件，并要求进行识别的计算机硬件具备足够的处理性能。OCR技术主要面对的是纸质材料，识别场景需要考虑很多问题，因此识别率会受到复杂因素的制约。识别率的核心技术指标是特征库。由于用户计算机硬件及处理器性能通常不具备足够要求，识别能力和特征库都受到用户计算机性能的限制，大大降低了 OCR技术对文本信息的识别率，不能准确的识别文本信息。同时，在对文本信息识别后还需要进行纠错。由于纠错的能力取决于特征库的信息量，特征库受到本机性能的限制，从而大大限制了纠错的能力，使得识别率进一步降低。
技术实现思路
有鉴于此，有必要提供一种识别率高的文本信息识别方法。此外，提供一种识别率高的文本信息识别系统。一种文本信息识别方法，包括如下步骤客户端获取包含文本信息的图像，并将所述图像发送至云服务器；所述云服务器接收所述图像，对所述图像进行处理，提取出所述图像中文本信息的字符；所述云服务器对所述字符进行处理，获取字符的特征；所述云服务器根据所述字符的特征，查询设置在所述云服务器上特征库，与特征库中的字符进行特征匹配，对字符进行识别，进而识别文本信息；所述云服务器将识别的文本信息发送至客户端。一种文本信息识别系统，包括客...

【技术保护点】
一种文本信息识别方法，包括如下步骤：客户端获取包含文本信息的图像，并将所述图像发送至云服务器；所述云服务器接收所述图像，对所述图像进行处理，提取出所述图像中文本信息的字符；所述云服务器对所述字符进行处理，获取字符的特征；所述云服务器根据所述字符的特征，查询设置在所述云服务器上特征库，与特征库中的字符进行特征匹配，对字符进行识别，进而识别文本信息；所述云服务器将识别的文本信息发送至客户端。

【技术特征摘要】

【专利技术属性】
技术研发人员：张富春，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人