识别在文档中使用的语言并且基于识别的语言执行OCR识别的方法和装置制造方法及图纸

技术编号：11584046 阅读：71 留言：0更新日期：2015-06-10 17:28

在此提供一种基于每个字符的笔画数识别文档中使用的语言的方法和装置。一旦识别，可以基于识别的语言进行字符识别。在一个实施例中，字符识别引擎用于字符识别，其中，字符识别引擎是为识别的语言特制的。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及确定文档中使用的是什么语言，并且更具体地涉及一种用于识别在文档中使用的语言，并执行基于识别的语言执行字符识别的方法和装置。
技术介绍
在大多数字符识别应用中，对每一个书写字符进行分析，并试图识别该字符。如已经使用字符识别的人所知，这个过程可能需要一定时间。例如，在常用的字符识别软件中，对一个15页的文档执行字符识别可能花费一分钟。如果可以减少这个时间段，将是有益的。因此，需要有一种比现有技术更快的执行字符识别的方法和装置。【附图说明】在附图的各个独立示图中，相同的附图标记是指相同或功能相似的要素，附图与在下面的具体实施例一起，被并入本说明书并且形成本说明书的一部分，以及用来进一步说明各种实施例，并且解释根据本专利技术的各种原理和优势。图1示出字符中的每个笔画被分离的字符。图2示出具有彼此交叉的笔画的字符。图3示出特定字符的笔画的确定。图4是示出光学字符识别(OCR)设备的框图。图5是示出图4的OCR设备的操作的流程图。图6示出薄线以帮助识别字符。本领域技术人员将理解的是，附图中的要素为了简明和清晰起见而被图示，并且不一定按比例绘制。例如，附图中的部分要素的尺寸可以相对于其它要素被夸大，以帮助提高对本专利技术的实施例的理解。而且，为了促进对于本专利技术的这些各种实施例的不太混乱的查看，通常不描绘在商业上可行的实施例中实用或必要的常见而公知的要素。应当进一步认识到，可以以特定的发生顺序来描述或描绘特定的动作和/或步骤，而本领域中的技术人员将理解，实际上不需要这样的关于顺序的指定。【具体实施方式】为了缓解上述需要，在本文中提供一种用于...

【技术保护点】
一种方法，包括以下步骤：接收文本；对于所述文本确定每个字符的平均笔画数；基于所述每个字符的平均笔画数识别所述文本所使用的语言。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：赵明熙，陈士杰，何启贞，林崴，
申请(专利权)人：摩托罗拉解决方案公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人