包括经历OCR处理的文本的图像的分辨率调整制造技术

技术编号：7978468 阅读：197 留言：0更新日期：2012-11-16 05:36

本发明专利技术提供了将接收到的图像重新缩放成最佳尺寸以便经受光学字符识别（OCR）处理的系统和方法。该系统包括最佳尺寸确定组件，其为图像确定最佳尺寸，以便不影响精度地使接收到的图像的处理时间最小化。最佳尺寸确定组件至少部分根据文本的主导行间距和主导文本高度确定图像的最佳尺寸。该系统还包括重新缩放组件，其将接收到的图像的尺寸重新调整成所确定的最佳尺寸。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】包括经历OCR处理的文本的图像的分辨率调整
技术介绍
光学字符识别(OCR)是一般在标准编码方案下，文本的图像到如机器可编辑文本的数字形式的基于计算机的转换。这个过程消除了将文档手工打字到计算机系统中的需要。由于差的图像质量、扫描过程造成的瑕疵等，可能引起许多不同的问题。例如，传统OCR引擎可以与扫描文本页面的平板扫描仪耦合。由于页面直接靠着扫描仪的扫描表面放置，因此扫描仪生成的图像通常呈现均匀的对比度和照明、减小的扭曲和失真以及高的分辨率。因此，OCR引擎可以容易地将图像中的文本转换成机器可编辑文本。然而，当图像关于对比度、亮度、扭曲等的质量较差时，OCR引擎的性能可能下降，并且处理时间可能由于处理图像中的所有像素而增加。例如，当图像由基于成像器的扫描仪生成时，可能就是这种情况，这是由于从远处、从变化的取向以及以变化的照明扫描文本/图片。即使扫描过程的性能是好的，当正扫描相对低质量的文本页面时，OCR引擎的性能也可能下降。
技术实现思路
进行OCR所需要的处理的图像的数量可能相当大，这需要大量的时间和处理能力。图像处理过程的持续时间几乎完全取决于输入图像尺寸。因此，当分辨率的任何进一步降低得到更低的精度，而同时分辨率的提高不会得到明显更好的精度时，可以认为该图像尺寸是最佳的(针对图像预处理过程而言)。这样，图像预处理算法在要求尽可能少的时间的同时提供了良好的精度。在一个实现方式中，图像的最佳尺寸根据图像中的文本的两种特性、具体地说，文本X-高度CW)和行间距(7Z幻来确定。一旦知道这些值，就可以精确地计算最佳图像分辨率。由于这些特性在整个图像中可能不是一致的，因...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：S加利奇，
申请(专利权)人：微软公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人