【技术实现步骤摘要】
【国外来华专利技术】从具有非均匀背景内容的电子扫描图像中提取文档页面图像
技术介绍
文档扫描系统可以包括图像捕获装置,该图像捕获装置用于产生针对由系统扫描文档页面或文档页的反射介质的反射率的空间变化的数字表示。捕获装置可以是例如接触式图像传感器(CIS)系统,其可以包括各种色彩的发光二极管(LED)的光源、分散光导和杆状透镜阵列。此外,CIS系统可以包括电荷耦合器件(CCD)半导体封装件或芯片,其可以端对端地布置以形成光敏元件阵列。CIS系统还可以包括用于将由光敏信号提供的信号转换为表示数字像素值的数据的硬件。附图说明图1是根据示例实施方式的用于扫描文档页面的电子扫描系统的示意图。图2是根据示例实施方式的图1的扫描系统的辊的透视图。图3、图4和图6是描绘根据示例实施方式的提取由扫描系统扫描文档页面的图像的技术的流程图。图5A示出了根据示例实施方式的包含文档页面和背景内容的图像的扫描合成图像。图5B示出了根据示例实施方式的从图5A的合成图像导出的较低分辨率缩略图像。图5C示出了根据示例实施方式的与合成图像的背景内容相关联的扫描仪响应。图5D示出了根据示例实施方式的在处理以移除特性化的背景内容之后的图5B的缩略图像。图5E描绘了根据示例实施方式的缩略图像的进一步处理以对缩略图像的像素强度进行二值化。图5F描绘了根据示例实施方式的噪声清除之后的二值化缩略图像。图5G示出了根据示例实施方式的与文档页面图像的边界的相对粗略近似相关联的边界像素的识别。图5H示出了根据示例实施方式的页面边界模型的初始化。图5I和图5J示出了根据示例实施方式的使用最小二乘拟合技术的页边界模型来细化文档页面图像的边 ...
【技术保护点】
1.一种方法,包括:获取表示通过抵靠背景对页面进行电子扫描而产生的第一图像的数据,其中所述第一图像包含非均匀背景内容,所述非均匀背景内容至少部分地归因于所述背景非均匀而引入的变化;以及从所述第一图像提取所述页面的图像,所述提取包括:将所述第一图像的所述背景内容特性化;至少部分地基于特性化的背景内容来识别与所述页面相关联的候选像素;以及至少部分地基于识别的候选像素和用于所述页面的边界的模型,确定所述页面的所述边界。
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:获取表示通过抵靠背景对页面进行电子扫描而产生的第一图像的数据,其中所述第一图像包含非均匀背景内容,所述非均匀背景内容至少部分地归因于所述背景非均匀而引入的变化;以及从所述第一图像提取所述页面的图像,所述提取包括:将所述第一图像的所述背景内容特性化;至少部分地基于特性化的背景内容来识别与所述页面相关联的候选像素;以及至少部分地基于识别的候选像素和用于所述页面的边界的模型,确定所述页面的所述边界。2.根据权利要求1所述的方法,进一步包括:处理表示所述第一图像的所述数据以生成表示所述页面和所述背景的第二图像的第二数据,相比于所述第一图像的分辨率,所述第二图像具有较低的分辨率;以及将所述第一图像的所述背景内容特性化,识别所述候选像素并使用所述第二图像确定所述页面的所述边界。3.根据权利要求2所述的方法,其中确定所述页面的所述边界包括:确定所述页面在所述第二图像中的边界;以及缩放所述页面在所述第二图像中的所述边界以确定所述页面在所述第一图像中的的所述边界。4.根据权利要求1所述的方法,其中识别所述候选像素包括:至少部分地基于所述像素与所述特性化的背景内容的不相似水平来向所述像素分配页面隶属度的程度,以生成表示所述页面的图像;以及过滤表示所述页面的所述图像以生成表示所述候选像素的图像。5.根据权利要求4所述的方法,其中过滤表示所述页面的图像包括应用形态学开放过滤器。6.根据权利要求1所述的方法,其中确定所述页面的所述边界包括:使用表示所述识别的候选像素的图像,在所述页面的边界的近似之后识别像素的坐标;以及至少部分地基于页面边界模型和识别的坐标来细化所述近似。7.根据权利要求1所述的方法,其中所述非均匀背景内容至少部分地归因于通过抵靠电子扫描系统的分段辊进行成像而引入的变化。8.根据权利要求1所述的方法,进一步包括:至少部分地基于所述页面的确定的边界来处理表示所述第一图像的所述数据,其中处理表示扫描图像的所述数据包括裁剪、歪斜校正或缩放所述扫描图像的与所述页面对应的像素。9.一种包括用于存储指令的非瞬态存储介质的物品,所述指令在由计算机执行时使所述计算机:处理表示扫描合成图像的数据以将所述扫描合成图像的背景内容特性化,并且至少部分地基于所述特性化来确定包含在所述扫描合成图像内的文档图像的边界...
【专利技术属性】
技术研发人员:D·M·贝范格,查理斯·贾,吴一枫,
申请(专利权)人:惠普发展公司,有限责任合伙企业,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。