文档扫描器制造技术

技术编号:17843912 阅读:68 留言:0更新日期:2018-05-03 22:37
本发明专利技术涉及用于生成可扫描文档的方法、系统和装置,其包括编码在计算机存储介质上的计算机程序。在一个方面中,一种方法包括:接收扫描请求,其中,所述扫描请求包括多个文本图像;对于所述多个文本图像中的每个文本图像:校正所述文本图像来生成具有平行图像线的文本图像,生成围住所述文本图像中的一个或者多个连接组件的多个词语边界框,其中,每个词语边界框与相应的词语相关联,以及,对于所述文本图像中的每个相应的词语,生成表示该相应的词语的多个点;将所述多个文本图像进行组合来形成单个文本文档;以及,提供所组合的图像作为可扫描文档。

Document scanner

The invention relates to a method, system and device for generating a scanned document, which includes a computer program encoded on a computer storage medium. In one aspect, one method includes receiving a scan request, wherein the scan request includes a plurality of text images, each text image in the plurality of text images: correcting the text image to generate a text image with parallel image lines, and generating one or more in the domicile of the text image. A plurality of word boundary frames connected to the component, in which each word boundary frame is associated with the corresponding words, and a plurality of points representing the corresponding words are generated for each corresponding word in the text image, and the plurality of text images are combined to form a single text document; and The combined image is used as a scanable document.

【技术实现步骤摘要】
【国外来华专利技术】文档扫描器
技术介绍
本说明书涉及图像处理。常规全景拼接是一种用于将具有重叠视场的多个摄影图像进行组合来产生分段式全景或者高分辨率图像的技术。例如,卫星图像和数字地图的高分辨率拼嵌图(mosaic)使用全景拼接。其它现有的应用——例如,医学成像和图像稳定——也应用全景拼接技术。捕获具有不同取向、角度、视角、和深度的图像通常会使最终拼接的图像失真。
技术实现思路
大体而言,本文描述的主题的一个方面可以以一种技术来实施,该技术包括:接收扫描请求,其中,该扫描请求包括多个文本图像,每个文本图像表示文本文档的一部分,其中,该多个文本图像包括至少部分地重叠的第一文本图像和第二文本图像;对于多个文本图像中的每个文本图像:校正文本图像来生成具有平行图像线的文本图像,生成围住该文本图像中的一个或者多个连接组件的多个词语边界框,其中,每个词语边界框与相应的词语相关联,以及,对于文本图像中的每个相应的词语,生成表示该相应的词语的多个点;将多个文本图像进行组合来形成单个文本文档,包括:通过匹配与第一文本图像相关联的第一点集和与第二文本图像相关联的第二点集来将多个文本图像中的第一文本图像和多个文本图像中的第二文本图像本文档来自技高网...
文档扫描器

【技术保护点】
一种计算机实现的方法,所述方法包括:接收扫描请求,其中,所述扫描请求包括多个文本图像,每个文本图像表示文本文档的一部分,其中,所述多个文本图像包括至少部分地重叠的第一文本图像和第二文本图像;对于所述多个文本图像中的每个文本图像:校正所述文本图像来生成具有平行图像线的文本图像,生成围住所述文本图像中的一个或者多个连接组件的多个词语边界框,其中,每个词语边界框与相应的词语相关联,以及对于所述文本图像中的每个相应的词语,生成表示该相应的词语的多个点;将所述多个文本图像进行组合来形成单个文本文档,包括:通过将与所述第一文本图像相关联的第一点集和与所述第二文本图像相关联的第二点集进行匹配,来将所述多个文...

【技术特征摘要】
【国外来华专利技术】2015.04.17 US 14/690,2741.一种计算机实现的方法,所述方法包括:接收扫描请求,其中,所述扫描请求包括多个文本图像,每个文本图像表示文本文档的一部分,其中,所述多个文本图像包括至少部分地重叠的第一文本图像和第二文本图像;对于所述多个文本图像中的每个文本图像:校正所述文本图像来生成具有平行图像线的文本图像,生成围住所述文本图像中的一个或者多个连接组件的多个词语边界框,其中,每个词语边界框与相应的词语相关联,以及对于所述文本图像中的每个相应的词语,生成表示该相应的词语的多个点;将所述多个文本图像进行组合来形成单个文本文档,包括:通过将与所述第一文本图像相关联的第一点集和与所述第二文本图像相关联的第二点集进行匹配,来将所述多个文本图像中的所述第一文本图像与所述多个文本图像中的所述第二文本图像进行组合;以及提供所组合的图像作为可扫描文档。2.根据权利要求1所述的方法,其中,校正所述多个文本图像中的每个文本图像包括:确定所述文本图像中的多个连接组件,每个连接组件是符号的填充部分;基于所述多个连接组件来生成在所述文本图像中的多个图像线,所述多个图像线包括垂直线元和水平线元;基于所述多个图像线来计算水平消失点和垂直消失点;以及将几何公式应用于所述第一消失点和第二消失点来恢复在所述文本图像中的平行线。3.根据权利要求2所述的方法,其中,所述多个图像线包括多个垂直线元和多个水平线元,每个垂直线元是穿过连接组件的竖直部分的骨架线,每个水平线元是穿过相邻连接组件集的中心的回归线。4.根据权利要求3所述的方法,其中,基于所述多个图像线来计算水平消失点和垂直消失点进一步包括:使用所述水平线元来计算所述水平消失点;以及使用所述垂直线元来计算所述垂直消失点。5.根据权利要求4所述的方法,进一步包括:选择垂直线元对和水平线元对,使用所选择的水平线元对来计算所...

【专利技术属性】
技术研发人员:克里希讷杜·乔杜里陈璐戴维·彼得鲁布勒斯·阿格拉阿尔卡斯
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1