基于图像匹配和网络查询的识别方法及系统技术方案

技术编号:4045273 阅读:245 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示了一种基于图像匹配和网络查询的识别方法及系统,所述方法包括:客户端获得包含有文字信息的图像;客户端将包含有文字信息的图像提交上传到服务器;服务器存有包含有文字信息的图像及该图像对应的文字信息;服务器将客户端提交的包含有文字信息的图像与所述服务器存有的包含有文字信息的图像进行匹配,在服务器存有的图像中获得与所提交的包含有文字信息的图像相似性程度符合设定要求的图像;将从服务器中获得的图像对应的文字信息作为识别结果。本发明专利技术采用图像匹配的技术,而不采用光学字符识别技术,能有效的处理基于光学字符识别技术无法准确识别的名片,提高了使用名片识别软件来输入名片信息的通用性,可靠性和便利性。

【技术实现步骤摘要】

本专利技术属于电子信息
,涉及一种图像匹配系统,尤其涉及一种基于图像 匹配和网络查询的识别方法;同时,本专利技术还涉及一种基于图像匹配和网络查询的识别系 统。
技术介绍
名片是人们经常使用的一种记载和传递联系方式的媒体,在日常商务活动中往往 会涉及大量的名片交换,人们通过名片交换的方式来传递联系方式,跟其他人建立联系。目前已经在手机和微机中广泛使用的名片识别技术利用图像处理和光学字符识 别(OCR,Optical Character Recognition)的原理,对相机拍摄或扫描仪扫描得到的名片 图像自动进行处理和识别,然后自动提取出其中的姓名,电话,email等有用信息来加入到 地址簿中去,为人们在电子设备中输入名片上记载的联系信息提供了很大的方便。一个例 子如多普达Touch Diamond手机中预装的名片识别软件。基于光学字符识别原理的名片识别技术有很大的局限性,其局限性之一是识别结 果是不可能达到100%的准确率,因而总是需要用户在保存识别出来的信息之前先对识别 结果进行人工的检查和校正,以保证所保存信息的正确性,否则的话,保存下来的电话号 码,email地址,网址等等中间哪怕仅仅错了一个符号,也成为无效的信息了。其局限性之 二是对很多个性化的背景复杂的名片,以及包含较多艺术字体的名片几乎无法识别,就算 识别出来错误率也特别高。其局限性之三是光学字符识别技术跟特定的语言的基本字符集 密切相关,需要针对每一种语言开发专门的光学字符识别技术,比如说只支持中文字符集 的光学字符识别技术就不能用来识别韩语和其他语言的名片。目前各种具有保存联系人信息功能的网站,如各种社交网站在人们日常生活中的 使用也已经非常普及了,如国内的QQ,开心网,国外的facebook,twitter, MSN等。用户先 进行注册,成为网站的注册用户,每个注册用户都会有一个联系人列表,同时每个注册用户 自己的联系信息也会纪录在他的账号信息中。名片的大小是有标准的,一般来说名片的标准尺寸是90*54mm。在拍摄用来进行识 别的名片图像中,一般要求在不超出图像边界的前提下,名片区域在图像中占据尽可能大 的区域,以便充分利用图像的分辨率,提高名片图像的识别准确率。但即使这样,有些信息 也很容易识别错误;更何况一些异体字、艺术字信息,一般的名片识别软件是无法识别的。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于图像匹配和网络查询的识别方法, 可提高使用名片识别软件来输入名片信息的通用性、可靠性和便利性。此外,本专利技术进一步提供一种基于图像匹配和网络查询的识别系统,可提高使用 名片识别软件来输入名片信息的通用性、可靠性和便利性。为解决上述技术问题,本专利技术采用如下技术方案一种基于图像匹配和网络查询的识别方法,所述方法包括如下步骤步骤101,客户端获得名片图像;步骤102,客户端将名片图像提交上传到网站的服务器;所述服务器存有名片图 像及该名片图像对应的名片信息;步骤103,网站的服务器将所提交的名片图像与该网站服务器存有的名片图像进 行匹配,获得一张或多张与所提交的名片图像相似性程度最高的名片图像,以及对应的表 示相似性程度的度量的值;步骤104,网站的服务器根据匹配的结果决定返回给客户端的内容;步骤105,客户端根据网站的服务器的返回内容来决定名片识别是成功还是失败, 若成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果;步骤106,结束。作为本专利技术的一种优选方案,所述步骤103中,网站的服务器经过图像匹配获得 一张或多张与所提交的名片图像相似性程度最高的服务器存有的名片图像,以及对应的表 示相似性程度的度量的值;所述表示相似性程度的度量的值是一个大于或等于0的数;如果所述表示相似性程度的度量的值为0,则表示网站的服务器存有的名片图像 中不存在与所提交的名片图像相似的图像,或者说匹配失败;如果所述表示相似性程度的度量的值大于0,则获得一张或多张与所提交的名片 图像相似性程度最高的服务器存有的名片图像,这些名片图像的获得方式是按照表示相似 性程度的度量的值的大小进行从大到小的排序,然后选取第一个或多个表示相似性程度的 度量的值所对应的名片图像。作为本专利技术的一种优选方案,所述步骤103中,网站的服务器将所提交的名片图 像与该网站的服务器存有的名片图像进行匹配;方法如下所有的名片图像,包括网站的服务器存有的名片图像和客户端所提交的名片图像 都要先进行初始化;所述网站的注册用户将名片图像保存到自己的账户中以后,网站的服务器就对这 个名片图像进行初始化,如果初始化失败,则要求用户重新提交另外一张名片图像,或者将 这张名片图像标记为不可用;客户端所提交的名片图像同样要先进行初始化,如果初始化失败,则表示这张名 片图像不能进行匹配,返回匹配失败;初始化成功才开始匹配。作为本专利技术的一种优选方案,所述初始化步骤包括步骤201,在名片图像中查找名片的四条边;步骤202,判断是否成功的找到名片的四条边;如果答案为是,转到步骤204,否 则转到步骤203 ;步骤203,初始化失败,转到步骤206 ;步骤204,根据所找到的名片的四条边对名片图像中的名片区域进行校正和归一 化;步骤205,将归一化后的名片图像二值化,得到仅有黑白两色的二值图像;步骤206,结束。作为本专利技术的一种优选方案,所述步骤204中,根据所找到的名片的四条边对名 片图像中的名片区域进行校正和归一化,是指去除名片的四条边外面的图像背景区域,并 将名片的四条边所框住的四边形区域经过坐标变换,变成一个大小统一的长方形图像,从 而得到归一化后的名片图像;所述统一的大小由预先的设置确定;客户端所提交的名片图像经过初始化之后,与同样经过了初始化的服务器存有的 名片图像进行匹配,获得表示相似性程度的度量的值,方法是比较两张黑白两色的二值图像,统计出它们之间像素值相同的像素的个数 totalNum ;所述个数totalNum作为两张名片图像的相似性程度的度量,个数totalNum的值 越大说明两张名片图像的相似性程度越高,个数totalNum的值越小说明两张名片图像的 相似性程度越低。作为本专利技术的一种优选方案,所述步骤104中,网站的服务器根据匹配的结果决 定返回给客户端的内容;所述网站的服务器决定返回客户端的内容的方式为如下四种方式 的一种方式之一是网站的服务器将一张或多张与所提交的名片图像匹配程度最高或最 相似的服务器存有的名片图像都返回给客户端,让用户自己去选择其中跟所提交的名片图 像完全一致的图像;在这种方式之下,如果从网站的服务器返回的名片图像中找不出跟所 提交的名片图像完全一致的图像,则表示识别失败,否则网站的服务器再将用户所选择的 名片图像对应的文字信息返回给客户端作为识别结果;方式之二是网站的服务器仅将表示相似性程度的度量的值超过一个预先设定的 阈值的名片图像返回给客户端,同样让用户自己去选择其中跟所提交的名片图像完全一致 的图像;在这种方式之下,如果网站的服务器没有返回名片图像,或者如果从网站的服务器 返回的名片图像中找不出跟所提交的名片图像完全一致的图像,则表示识别失败,否则网 站的服务器再将用户所选择的名片图像对应的文字信息返回给客户端作为识别结果;方式本文档来自技高网
...

【技术保护点】
一种基于图像匹配和网络查询的识别方法,其特征在于,所述方法包括如下步骤:步骤101,客户端获得名片图像;步骤102,客户端将名片图像提交上传到网站的服务器;所述服务器存有名片图像及该名片图像对应的名片信息;步骤103,网站的服务器将所提交的名片图像与该网站服务器存有的名片图像进行匹配,获得一张或多张与所提交的名片图像相似性程度最高的名片图像,以及对应的表示相似性程度的度量的值;步骤104,网站的服务器根据匹配的结果决定返回给客户端的内容;步骤105,客户端根据网站的服务器的返回内容来决定名片识别是成功还是失败,若成功,则将从网站的服务器中获得的名片图像对应的文字信息作为识别结果;步骤106,结束。

【技术特征摘要】

【专利技术属性】
技术研发人员:罗希平
申请(专利权)人:上海合合信息科技发展有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1