The invention discloses a document image processing device and a method. The device includes: an information acquisition unit, acquiring a stored document model corresponding to a paper document carrying a tag and information of a document image captured from a paper document, wherein the tag includes a first tag and a second tag, a first tag detection unit, detecting the first tag in the document image and obtaining the attitude of the first tag, and a second tag determination unit. The second tag in the document image is determined according to the transformation and the information of the stored document model, the transformation is determined according to the attitude of the first tag and the information of the stored document model, and the information transformation unit converts the information of the stored document model to the document image according to the updated transformation, in which the update is made. The transformation is updated based on the transformation and the second tag. Compared with the prior art, the present invention will improve the accuracy of coordinate transformation from document to document image.
【技术实现步骤摘要】
文档图像处理装置及方法
本专利技术涉及计算机视觉系统,更具体地,本专利技术涉及文档图像处理方法及装置,所述文档图像处理方法及装置将文档的坐标转换到对应的文档图像。
技术介绍
随着增强现实(AR)技术的发展,虚拟信息与实物或捕捉的实物图像叠加显示相应地尤为重要。近几年来,该技术被广泛应用于许多情境,例如面对面的商务会议,在这些情境中,需要确定文档姿态(例如,位置和方向)并进一步显示文档周围的一些相关内容。但在真实环境中,因为例如亮度变化、纸张变形等各种因素的一些影响,所以难以稳定、精确地确定文档姿态。近几年来,利用标记,进行基于AR技术的跟踪可得到文档姿态。美国专利US8233200B2公开了一种示例性的用于对象姿态识别的基于AR标记的跟踪技术,该技术包括:将已知表格的模型图像划分为通过至少三个对齐标记限定的区段,并且通过将捕捉的图像上对齐标记的位置与模型图像上对齐标记的位置进行比较,为每一个区段生成一个转换函数,然后将所述转换函数应用到区段内的其他标记来计算标记的正确位置。美国专利US7317557B2公开了另一种示例性的用于对象姿态识别的基于AR标记的跟踪技术,该技术提供了一种使用标记将文档图像的坐标转换为打印文档的坐标的方法。在相机从纸质文档或打印文档捕捉文档图像的情况下,有时纸质文档弯曲(bent)、卷曲(rolled)或折叠(folded),因此所捕捉的文档图像可能会变形。并且由于变形,因此无法准确进行坐标变换。为了减小偏差,通用方法是在纸质文档上靠近目标位置或给定位置处添加标记。但是,由于标记必须足够大以被检测到以及与其他文档内容区分开,因此对于 ...
【技术保护点】
1.一种文档图像处理装置,所述装置包括:信息获取单元,被构造为获取与携带标记的纸质文档对应的存储的文档模型以及从纸质文档捕捉的文档图像的信息,其中所述标记包括第一标记和第二标记;第一标记检测单元,被构造为检测所述文档图像中的所述第一标记并且获得所述第一标记的姿态;第二标记确定单元,被构造为根据变换和所述存储的文档模型的所述信息确定所述文档图像中的所述第二标记,其中所述变换根据所述第一标记的所述姿态和所述存储的文档模型的所述信息确定;及信息变换单元,被构造为根据更新的变换将所述存储的文档模型的所述信息变换到所述文档图像,其中,所述更新的变换基于所述变换和所述第二标记更新。
【技术特征摘要】
1.一种文档图像处理装置,所述装置包括:信息获取单元,被构造为获取与携带标记的纸质文档对应的存储的文档模型以及从纸质文档捕捉的文档图像的信息,其中所述标记包括第一标记和第二标记;第一标记检测单元,被构造为检测所述文档图像中的所述第一标记并且获得所述第一标记的姿态;第二标记确定单元,被构造为根据变换和所述存储的文档模型的所述信息确定所述文档图像中的所述第二标记,其中所述变换根据所述第一标记的所述姿态和所述存储的文档模型的所述信息确定;及信息变换单元,被构造为根据更新的变换将所述存储的文档模型的所述信息变换到所述文档图像,其中,所述更新的变换基于所述变换和所述第二标记更新。2.根据权利要求1所述的装置,其中所述存储的文档模型的所述信息至少包括:所述存储的文档模型的坐标、与所述纸质文档对应的所述第一标记的位置或方向或角度、与所述纸质文档对应的所述第二标记的位置。3.根据权利要求1所述的装置,其中所述第二标记确定单元:计算所述第二标记的暂定位置;分割所述文档图像以获得候选第二标记;计算每一个候选第二标记与所述暂定位置之间的距离;并且在所述距离小于阈值的情况下,所述候选第二标记为所述第二标记。4.根据权利要求1所述的装置,其中所述第二标记确定单元:计算所述第二标记的暂定位置;分割所述文档图像以获得候选第二标记;根据所述候选第二标记的尺寸、形状及所述候选第二标记与所述暂定位置之间的距离,计算每一个候选第二标记的分值;在所述候选第二标记分值最高的情况下,所述候选第二标记为所述第二标记。5.根据权利要求3或4所述的装置,其中所述第二标记的所述暂定位置根据所述变换和所述存储的文档模型中的所述第二标记的坐标计算。6.根据权利要求5所述的装置,其中所述更新的变换根据所述变换和所述文档图像中所述第二标记的暂定位置相对于所述第二标记的位置的坐标偏移更新。7.根据权利要求1所述的装置,其中所述更新的变换根据所述变换和所述文档图像中的给定位置与所述第二标记的位置之间的坐标偏移更新。8.根据权利要求7所述的装置,其中所述坐标偏移为加权平均坐标偏移,所述加权平均坐标偏移根据所述坐标和所述第二标记与所述给定位置之间的距离的倒数的对应权重确定。9.根据权利要求1所述的装置,其中所述第一标记包括第一识别部分和在一个方向展开的第二识别部分。10.根据权利要求9所述的装置,其中所述第一标记检测单元:确定所述文档图像中所述第一标记的候选第一识别部分;基于所述第一标记的所述候选第一识别部分的位置,确定所述第一标记的候选第二识别部分;验证所述第一标记的所述候选第二识别部分;在所述候选第二识别部分为所述第二识别部分的情况下,确定所述第一识别部分。11.根据权利要求10所述的装置,其中所述信息变换单元基于所述文档图像中所述第一识别部分的姿态,确定文档图像的姿态。12.根据权利要求9所述的装置,其中所述第一标记的所述第一识别部分的形状与所述第一标记的所述第二识别部分的形状不同。13.根据权利要求9所述的装置,其中所述第一标记的所述第一识别部分包括头部和尾部,其中所述第一标记的所述第二识别部分位于所述第一识别部分的所述头部与所述尾部之间。14.根据权利要求13所述的装置,其中所述第一识别部分的所述头部和所述尾部由形状或尺寸相同或不同的元素组成,并且...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。