由装备于通信终端的照相机进行数字获取、存储和/或传输信息的方法技术

技术编号:3589112 阅读:130 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及选择由照相机(CN)拍摄的数字化区域,校正投影畸变,增强分辨力,然后二值化的方法,包含下列操作步骤:在要处理的文档(0)中或在要处理的文档(0)周围生成一个闭合的人工产生或印制的轮廓线(DC);将要处理的文档(0)以一个角度展现在照相机(CN)前面,使得在可视化屏幕(AF)上存在的图像内完全可见所述轮廓线;记录该图像并在图像内搜索该轮廓线;计算投影畸变(块CC)提取和合成图像内容并产生最终图像。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及利用装备于通信终端的照机机进行数字获取介质上存在的信息的方法。它的目的是使该终端能存储和/或传送这一信息到收件人,应该理解,为了使它能被使用,这一信息应被提取出来并特别考虑投影畸变以进行校正和/或通过纳入背景和/或文本数据使这一信息完整。 它特别地但不是排他地适用于传输和存储作为由照相机在任何入射条件下被预览的文本数据和数字扫描的图形,然后进行投影畸变校正处理,并可能以增强的分辩力进行处理。 这样的过程特别适合于传输由装备于便携通信终端,例如蜂窝无线发射机/接收机,的照机机拍摄的文本和/或图形信息。
技术介绍
的确,对于这类应用,当人们希望向某个地址传送从一个照片中提取的书写消息时,往往需要进行校正,如果没有这一校正,在由该地址接收的照片中出现的消息就会是难以辩认的。再有,人们还希望进一步把外部模式(pattern),例如在设备的键盘上输入的解说词,纳入被传送的图像,或者甚至将照相机拍摄的图像和例如可能从该单元可访问的库中选择的背景二者重叠起来。 人们普遍知道信息在今天已是无处不在,而对信息的控制是至关重要的;现在这一信息大量地由文本数据构成。 知识,不论是技术的,科学的、历史的、经济的、法律的、或是医学的知识,大多是以文本存储和传送;近来公布的知识直接可以以电子形式访问;另一方面,历史遗留的知识大多数仍然只能以纸文档形式得到。 社会面临大量的重处理需求,也称作回溯转换,用以改变成电子形式。 文档识别与图像识别相关联;它涉及关于书写语言及其数字变换的所有问题字符识别、编排文本格式、内容构成和通过其索引访问信息。 于是,这是一个重新发现已存在的结构从而使识别变到所研究的文档类别的显式或隐式模型指导的问题。该模型描述构成该文档的项目及各项目之间的关系,这一描述可以是物理的,如通过给出页构成格式。 再有,已知由人对照相机接收的文本或图形进行的解释是假定相对于载有文本或图形的文档进行准正交的或垂直的拍摄并具有足够的分辩力来区分细节。 容易理解,由接收消息的个人读取文本时将大大受益于相对文本平面正交或准正交入射;至于图形的解释,几乎是不可避免地要求符合其形状和比例。 最后,字符和文本的识别已取得很大进步;扫描仪为其后的识别步骤提供了足够的分辩力;这些识别步骤是 -获取或数字化, -拉直, -定量化, -二值化, -页分段, -字符识别 -逻辑结构识别。 为提高分段和自动字符识别的质量,希望文档的图像完好地拉直和具有足够的分辩力;这特别有助于在两个相继的文本列彼此很靠近时对文本列的搜索,以及若字母大小被特别减小时对字符的识别;所以,需要检测页的全局偏移角和需要增强对图像的确定性,特别是对于来自照相机的图像,如果没有足够好的质量以区分在某一距离拍摄的文本或图形的细节或保证识别字符所需最小分辩力的话,则更需要如此;已经开发出若干算法来检测文本的倾斜角;然而,在扫描平面内该倾斜角不应超过10-20°。 当由照相机以任何入射角观看文档时,困难变得不可克服,因为该文档已受到投影畸变发现从照相机的某一距离开始,图像中为识别字符和其后理解该文档所需要的那些细节消失了。
技术实现思路
更具体地说,本专利技术的目的是消除这些缺点并允许存储和/或向一个地址传送被校正的信息,其中可能包括背景和/或正文数据。 当然,为达到这一结果,本专利技术建议的解决方案考虑由于标准通信终端的大小和由于硬、软件资源及传输速率所造成的限制, 因此,根据本专利技术的方法包含下列步骤 -由照相机拍摄至少一幅图像, -由集成到所述终端中的处理装置至少是部分地提取所述图像中包括的可识别的上下文数据, -由所述处理装置提取关于所述信息的原始数据, -将原始数据存储在所述终端的存储器中和/或将数据传送到一个接收器, -借助于上下文数据,由所述终端的处理装置和/或所述接收器校正原始数据, -由所述终端或由所述接收器将校正后的数据传送给收件人, 有利地 -这一方法可包含拍摄若干图像并在校正之前和之后组合或选择所提取的数据, -上下文数据和原始数据可被传送到前述接收器,该接收器可按来自前述终端的请求采取前述校正和将校正后数据传送给收件人, -校正可由终端的处理单元进行,而校正后的数据可由该终端直接地或经由接收器间接地传送给收件人, -上下文数据可传送给接收器,它可进行对这些数据的处理和向终端传送控制指令,以允许终端的处理装置进行对原始数据的校正, -与所述信息关联的上下文数据和原始数据可传送给接收器,它可进行前述校正并将校正后的数据传送给收件人,以及发出控制指令以允许终端的处理装置本身进行对原始数据的校正, -前述终端可包含访问图像库的装置以及将校正后的数据键控插入至少一个选定图像的装置。 再有,根据本专利技术的方法中提供的校正步骤可包含如下操作阶段 -或者由人工产生或印制的图(例如四边形、矩形)或借助任何凹形材料框,在要处理的文档内或在要处理的文档周围产生一个轮廓线, -把要处理的文档以任何入射角呈现在照相机前面,使得在观察屏上呈现的图像中完全可见前述轮廓线, -在图像中进行轮廓线搜索, -计算投影畸变,提取和组合多个图像的内容, -产生最终图像。 有利地,利用这一方法,有可能 -有助于由相关人员解释所接收的文档, -从这相关人员的物理描述重建文档结构, -由当今技术中已知的软件包进行字符识别, -通过通信网络(如因特网、蜂窝网络(如GSM、GPRS或UMTS网络)发送文档, -将文档存储在由当今技术中已知的适当介质上, -减小数字化信息的大小,从而减小为其存储所需存储器并增大这一信息的传输速率。 在这一情况中,根据本专利技术的方法可涉及 -将处理和存储装置组合在一起的中央单元, -与中央单元连接的照相机,优选地,固定于或集成于该中央单元, -用于观看由照相机拍摄图像的屏幕, -用于传输和存储数字化信息的装置。 文档的回溯转换,即其向电子格式的转换,将由于本专利技术而成为可能,从而允许它被利用,传输和存储。 附图说明 下面将参考附图描述本专利技术的实施例作为非限定性举例,这些附图是 图1示意性表示提取和校正由装备有照相机的通信终端拍摄的图像中含有的信息的系统; 图2示意性说明在任何入射角下进行拍摄所遇到的问题; 图3展现关于获取图像和搜索图像中轮廓线的流程图; 图4展现关于提取,组合各图像的内容并生成最终图像的流程图; 图5展现关于搜索图像中轮廓线详细流程图; 图6展现关于选择轮廓线和计算图像中找到的轮廓线的投影畸变的详细流程图; 图7展现关于组合所找到的轮廓线中含有的信息和增强图像反差的详细流程图; 图8展现关于得到最终图像的详细流程图; 图9示意性说明作为图形选择轮廓线的方式; 图10示意性说明选择轮廓线的另一种方式。 具体实施例方式 在图1中展现的例子中,应用根据本专利技术的方法所使用的系统涉及通信终端TC,包括发射机TR,如GSM移动电话,传统上含有发送器E1和接收器R1。该TC终端装备有数字照相机CN,用于拍摄含有文本数据DT和上下文数据CD的介质O。 根据本专利技术,本文档来自技高网
...

【技术保护点】
一种利用装备于通信终端(TC)的照相机(CN)用于数字获取介质(O)上存在的信息并存储和/或通过这一终端(TC)将所述信息传递给收件人(DES)的方法,其特征在于它包含如下步骤:-以照相机(CN)拍摄介质(O)的至少一幅图像,-由集成于所述终端(TC)的处理装置(EC、EDTB)至少是部分地提取在所述图像中包括的可识别的上下文数据(DC),-由所述处理装置(EC、EDTB)借助上下文数据提取关于所述信息的原始数据,-将所提取的信息存储在所述终端(TC)的存储器中和/或传递给接收器(REC),-由所述终端(TR)的和/或所述接收器(REC)的处理装置(CC-TRC)借助上下文数据校正原始数据,-由所述终端(TS)或由所述接收器(REC)将校正后的数据传递给收件人(DES)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:马丁莱弗布尔
申请(专利权)人:瑞尔视觉三维公司
类型:发明
国别省市:FR[法国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利