结合文字识别和图像匹配交换名片信息的方法技术

技术编号:6915668 阅读:437 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种结合文字识别和图像匹配交换名片信息的方法,应用在由网站服务器、第一、第二客户端构建的网络系统中,该方法至少包括:第一客户端将获取的第二客户端用户的名片图像上的文字信息和图像特征后上传至网站服务器,网站服务器从名片资料库中检索出与该文字信息相匹配的所有预存名片,并进行图像特征匹配,然后根据图像特征的相似度选取出候选名片,并判断该候选名片是否属于该第二客户端用户,若是,则在第二客户端应允后,网站服务器将第二客户端用户的名片信息发送给第一客户端,同时也将第一客户端的名片信息发送至第二客户端;若否,则结束步骤,以此来确保名片信息交换的准确率和识别速度,并进一步保护名片主人的隐私。

【技术实现步骤摘要】

本专利技术涉及一种属于图像处理和网络应用的
,特别是涉及一种结合文字识别和图像匹配来确认名片主人并交换名片信息的方法。
技术介绍
名片是人们经常使用的一种记载和传递联系方式的媒体,在日常商务活动中往往会涉及大量的名片交换,人们通过名片交换的方式来传递联系方式,跟其他人建立联系。目前已经在手机和微机中广泛使用的名片识别技术,即利用图像处理和光学字符识别(OCR,Optical Character Recognition)的原理,对数码相机拍摄或扫描仪扫描得到的名片图像自动进行处理和识别,然后自动提取出其中的姓名、电话、E-mail等有用信息来加入到地址簿中去,为人们在电子设备中输入名片上记载的联系信息提供了很大的方便。 例如多普达Touch Diamond手机中预装的名片识别软件。在目前的名片识别的应用实例中,如果用户A和用户B交换了名片,则他们需要分别手工或者使用名片识别软件去把对方的名片信息加入到自己的电子设备的联系人列表中去。我们可以把名片识别得到的文字传给某个网站的服务器,利用识别出来的名片中的文字信息如姓名,电话号码,电子邮箱等等在该网站的注册用户中找到名片主人,进而与名片主人实现电子名片信息的交换,但是基于光学字符识别原理的名片识别技术识别结果是不可能达到100%的准确率的,把经过光学字符识别获得的可能包含错误的文字信息传递给特定网站的服务器,在很多情况下网站的服务器不能根据由光学字符识别得到的文字来唯一确定这些文字属于网站的哪一个注册用户保存的名片,或者是否属于网站的注册用户所保存的名片。比如说,有些公司的销售人员的名片,除了姓名不同其它的信息如公司名称,地址,联系电话,电子邮件地址等都是一样的,这个时候如果名片中的姓名的文字没有识别出来,网站的服务器就不可能根据其它文字信息来确定这张名片的主人是谁。所谓的图像匹配是指判断两张图像中拍摄的物体是不是同一个物体,学术界对图像匹配的研究已经有很多年了,一般的做法是找出图像中所拍摄物体的一些特征点, 然后依据这些特征点周边一定范围内的像素值来得到一个特征向量,通过特征点和特征向量的匹配来判断图像中拍摄的物体是不是同一个物体,如论文“Speed-up Robust Feautre(SURF),,(Herbert Bay,Andreas Ess,Tinne Tuytelaars,Luc Van Goo1,Computer Vision and Image Understanding 110(2008)346-359)中就比较详细描述了这样一种方法;在另一篇学术论文"Rate-efficient, real-time cd cover recognition on a camera-phone,,(Sam S. Tsai,David Chen,Jatinder Pal Singh,Bernd Girod,Proceeding of the 16th ACM international conference on Multimedia)中则描述了一个利用图像匹配来在10000张存在于数据库中的⑶封面图像中查找出与输入的图像最接近的那张⑶ 封面的实际系统。把图像匹配的方法用到名片识别中来,简单直观的做法是对每张传送给网站服务器要求进行识别获得其中包含的文字的名片图像,提取特征然后用某种图像匹配的算法来在服务器包含的所有名片的图像中查找跟输入的名片图像最相似的那张名片,返回那张名片的文字信息给用户。但是,这种做法存在的问题主要是其一,图像匹配的方法速度太慢,由于服务器的数据库中保存的名片图像会非常庞大,一般可能需要从几百万,几千万,甚至几个亿的不同名片的图像中查找出与输入的图像相同的那张名片来,另一个方面,在实际应用中,网站的服务器可能每天需要处理几十万甚至几百万次的识别名片的请求,这个工作量是目前的计算硬件和图像匹配的算法几乎不可能完成的任务。其二,图像匹配的方法准确率不够高。名片中包含了用户的姓名、电话号码、电子邮件、地址、公司名称和职务等等,这些都是隐私性比较强的信息,如果用户请求识别的是一张名片,而网站的服务器返回的是另一张名片对应的文字信息,就涉及到侵犯返回的那张名片主人的隐私了。所以用图像匹配的方法来做名片识别对识别准确率的要求可以说是 100%的,这里识别准确率我们是指100次成功得到了网站的服务器返回的文字信息的识别请求中,有多少次网站的服务器返回的文字信息确实就是要求进行识别的名片图像所包含的文字信息。但是,在保证识别准确率的前提下,拒识率还要越低越好,否则这个名片识别就失去了实际使用的价值了。上述的拒识率我们是指提交给网站的服务器的100次名片识别请求中,有多少次被网站的服务器告知不能识别,不能识别的原因可能是网站的服务器中没有保存所提交的那张图像所拍摄的名片的图像和对应的文字信息,也可能是网站的服务器不能确定所提交的那张图像拍摄的是哪张名片,因而拒绝返回对应的文字信息。目前的图像匹配算法要保证识别准确率100%,但是,其拒识率通常会比较高。因而,如何提供一种可以结合文字识别和图像匹配的名片信息交换技术,以解决现有技术中的种种问题,已经成为本
从业者亟待解决的问题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种,用以确保名片信息交换的准确率和识别速度,并能够进一步保护名片信息的隐私性。为实现上述目的及其他相关目的,本专利技术提供一种,应用于至少由网站服务器、第一客户端及第二客户端构建的网络系统中, 所述网站服务器具有预存名片信息的名片资料库,所述第一及第二客户端具有名片图像撷取、文字信息识别及图像特征提取功能,其特征在于,所述交换名片信息的方法至少包括以下步骤1)所述第一客户端撷取所述第二客户端用户的名片图像后,识别所述名片图像上的文字信息,并提取图像特征;幻所述第一客户端将识别的文字信息和提取的图像特征上传至所述网站服务器,并发送名片识别请求;;3)所述网站服务器接受到该名片识别请求后,依据所述文字信息从所述名片资料库中检索与该文字信息相匹配的所有预存名片,并将检索出的各该预存名片的名片图像分别与所述第二客户端用户的名片图像进行图像特征匹配,根据图像特征的相似度,对应每一预存名片生成一个相似程度的度量值;4)所述网站服务器将所有预存名片中度量值最大的一张名片作为候选名片力)判断所述候选名片是否属于所述第二客户端用户,若是,则所述网站服务器向所述第二客户端发出交换请求,在所述第二客户端应允后,所述网站服务器将第二客户端用户的名片信息发送给所述第一客户端,同时也将所述第一客户端的名片信息发送至第二客户端;若否,则结束步骤。在本专利技术的交换名片信息的方法中,所述名片信息包括名片图像、文字信息、以及名片主人的图像、音频、或视频信息。所述文字信息为名片上的姓名、职称、电话、传真、地址、邮编、电子信箱、网站地址、产品信息中的至少一种。在本专利技术的交换名片信息的方法的步骤1)中,所述第一客户端是通过数码拍摄装置或扫描装置撷取所述第二客户端用户的名片图像。所述第一客户端是利用光学字符识别技术识别所述名片图像上的文字信息和提取图像特征。在本专利技术的交换名片信息的方法中,所述网站服务器预设有用于与所述度量值相比对的参照值,且本文档来自技高网
...

【技术保护点】
1.一种结合文字识别和图像匹配交换名片信息的方法,应用于至少由网站服务器、第一客户端及第二客户端构建的网络系统中,所述网站服务器具有预存名片信息的名片资料库,所述第一及第二客户端具有名片图像撷取、文字信息识别及图像特征提取功能,其特征在于,所述交换名片信息的方法至少包括以下步骤:1)所述第一客户端撷取所述第二客户端用户的名片图像后,识别所述名片图像上的文字信息,并提取图像特征;2)所述第一客户端将识别的文字信息和提取的图像特征上传至所述网站服务器,并发送名片识别请求;3)所述网站服务器接受到该名片识别请求后,依据所述文字信息从所述名片资料库中检索与该文字信息相匹配的所有预存名片,并将检索出的各该预存名片的名片图像分别与所述第二客户端用户的名片图像进行图像特征匹配,根据图像特征的相似度,对应每一预存名片生成一个相似程度的度量值;4)所述网站服务器将所有预存名片中度量值最大的一张名片作为候选名片;5)判断所述候选名片是否属于所述第二客户端用户,若是,则所述网站服务器向所述第二客户端发出交换请求,在所述第二客户端应允后,所述网站服务器将第二客户端用户的名片信息发送给所述第一客户端,同时也将所述第一客户端的名片信息发送至第二客户端;若否,则结束步骤。...

【技术特征摘要】

【专利技术属性】
技术研发人员:罗希平
申请(专利权)人:上海合合信息科技发展有限公司
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1