一种基于云技术的名片识别方法技术

技术编号:7628634 阅读:327 留言:0更新日期:2012-08-01 22:27
本发明专利技术公开了一种基于云技术的名片识别方法,属于信息技术领域。本方法为:1)名片识别终端采集名片的图片,并将其上传到云端数据服务器;2)数据服务器将该名片图片转发至OCR识别服务器,重建一数字名片;3)识别服务器将识别后的数据发送给数据服务器;数据服务器在通过审核数字名片中查找匹配的名片,标记该数字名片中与匹配名片不一致的属性;4)审核终端对该数字名片进行审核,判断是否与对应名片图片内容符合;如果符合,则标记为通过审核;如果不符合,则发送成功信息给录入终端;如果无法识别,则发送失败信息给识别终端;5)录入终端修改该数字名片的识别信息后,将其发送给数据服务器。本发明专利技术大大提高名片识别的准确性和效率。

【技术实现步骤摘要】

本专利技术涉及,结合0CR(0ptical CharacterRecognition,光学字符识别)识别高效性和人工审核准确性,并通过云技术将识别结果快速地返回给识别终端。本专利技术属于信息技术处理领域。
技术介绍
名片在日常的商务活动、社交活动有着重要的作用,名片识别也因此成为非常实用的功能。目前主要的名片识别方法依赖OCR技术,使用OCR对名片中的文字进行识别,然后根据名片的文字信息重新组建一个数字化名片。然而由于光照、背景、图片质量等因素,OCR并不能达到一个十分理想的效果,即使是电话或者邮箱中错一个字符,也会导致用户通信失败。OCR识别的结果需要用户手动矫正名片识别结果,这影响了名片识别的效率。云计算,是一种基于互联网的计算方式,通过这种方式,共享资源和信息可以按需提供给计算机和其他设备。
技术实现思路
针对现有现有名片识别技术中存在的技术问题,本专利技术提出一种准确高效的名片识别方法,本专利技术使用云技术对名片进行识别,实现准确性和录入效率的最优结合。本专利技术的技术方案为,其步骤为I)名片识别终端采集名片的图片,并将其上传到云端数据服务器;2)数据服务器将该名片图片转发至OCR识别服务器;0CR识别服务器识别该名片图片中的文字,重建一数字名片,并将图片名片的保存路径、该数字名片及数字名片中每一属性的准确度存储到数据库中;3) OCR识别服务器将识别后的数据发送给数据服务器;数据服务器在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记该数字名片中与匹配名片不一致的属性;4)审核终端对该数字名片进行审核,判断是否与对应名片图片内容符合;如果符合,则将该数字名片标记为通过审核并发送给识别终端;如果不符合,则将该数字名片标记为重新识别并标明出错的原因后发送给录入终端进行人工录入;如果名片图片无法识别,则将该数字名片标记为识别失败并发送给识别终端;5)录入终端根据该数字名片对应的名片图片修改该数字名片的识别信息后,将其发送给数据服务器。进一步的,所述名片识别终端对该采集的图片进行切分提取出名片,得到一矩形的灰度的名片图片。进一步的,所述数据服务器根据邮箱、和/或电话、和/或姓名识别信息在存储的通过审核数字名片中查找与该数字名片匹配的名片并进行比较,标记不一致属性。进一步的,所述数据服务器对待审核的名片按照时间顺序和识别的准确度排序,审核终端按照排序对数字名片进行审核。进一步的,所述录入终端根据该数字名片中的电话或者邮箱识别信息从数据服务器存储的通过审核数字名片数据库中查找匹配的数字名片,如果有,则将匹配的数字名片信息填充到该数字名片的录入属性中,供录入终端修改。进一步的,OCR识别服务器识别文字同时获取文字的准确度。与现有技术相比,本专利技术的积极效果为 I)结合OCR文字技术和基于云技术人工审核,最优地发挥自动化识别的效率与人工识别的准确性。OCR识别能够批量高效识别名片中的文字,然而准确性不高。人工录入名片准确可靠,但效率不高。本专利技术使用云技术将OCR识别,人工录入,人工审核有效的结合起来,达到效率和准确性的最优结合。2)名片录入时首先录入名片中易于输入的属性(如电话,邮箱),从现有数字名片数据库中查询名片,使用已经录入的数字名片提高名片录入的效率。要识别的名片中可能会有大量重复的名片,录入人员重新录入这些名片不仅浪费时间,而且还可能出现差错。从现有数字名片数据库中检索出这些名片,自动将属性填充到录入界面,录入人员只用编辑那些不一致部分。日常生活中,邮箱具有很高的唯一性,电话号码虽然不唯一但是易于输入,通过电话号码或者邮箱检索数字名片可以有效提高录入效率。3)0CR识别后的数字名片与通过审核的数字名片进行比较来提醒审核人员需要关注的属性。OCR识别是不可靠的,使用OCR识别的文字也是基于统计的结果。OCR识别的结果与现有通过审核的名片不一致的地方,往往是OCR识别发生错误的地方,或者将要识别的名片中改动的地方,标记这些属性可以方便审核人员快速发现识别中错误。附图说明 附图为本专利技术的方法流程图。具体实施例方式下面结合附图对本专利技术的实施方式进行进一步的描述I.拍摄名片。名片识别终端使用摄像头拍摄名片的图片。2.名片切分。使用参考文献提供的算法识别并切分名片。名片切分后,得到一个矩形的灰度的名片图片。切分后的名片方便OCR识别,提高OCR识别的成功率,同时减少上传数据的大小。3.上传图片。将提取的名片图片上传到数据服务器(云端),数据服务器将图片转发至OCR识别服务器。4. OCR识别。OCR识别服务器使用OCR弓丨擎识别名片图片中的文字,根据文字内容和版式重建数字名片,OCR识别文字的同时获取该文字识别的准确度,将其保存到数字名片的属性中。将数字名片、属性的准确度和图片名片的保存路径存储到数据库中。名片中包含姓名、公司、职位、地址、邮编、电话(移动电话,固定电话)、电子邮箱、传真、公司网址等信息。部分属性会出现明确的属性名称,如电话、邮箱、传真,这些属性可以根据属性名 称确定。而姓名、公司、职位、地址、邮编等字段没有属性名,可以根据名片的文字内容、版式进行区分。例如姓名往往是字号最大的字体,公司名中会经常出现“公司”字样,地址中会出现“省”、“市”,邮编紧跟在地址后面等等。准确度用来给审核人员指出重点审核部分。准确度为O表示OCR识别失败。OCR失败的名片图片由录入人员进行人工录入。5.初步校验。数据服务器收到OCR识别后的数据(数字名片和识别准确度)后,根据邮箱,和/或电话,和/或姓名字段为唯一标识在现有数据库中通过审核的名片查找匹配的名片并进行比较,标记提交数字名片不一致的属性。6.审核。审核人员登录审核终端,通过审核终端查看需要审核的名片。审核终端可以是网页,也可以是独立的审核客户端程序,其中网页的兼容性做好。审核终端显示OCR识别的准确度和步骤5标记的不一致属性,作为重点审核属性。根据数字名片的准确性做如下处理a)数字名片与名片图片内容符合。审核人员将名片标记为通过审核,该数字名片将作为名片识别的结果由数字服务器下发到识别终端。b)数字名片与名片图片内容不符合,数字名片中出现错误或者遗漏。审核人员将名片标记为重新识别,并标明出错的原因。该名片将会由录入人员进行人工录入。c)名片图片本身不是名片,或者看不清楚。审核人员将名片标记为识别失败。最终识别终端将会收到失败的信息,并提示给用户。此外,待审核的名片按照时间顺序和识别准确度排序,以保证名片按照上传的顺序从易到难被审核。7.录入。录入人员登录录入终端(网页或者录入客户端程序),查看标记为重新识别的数字名片,即需要人工录入的名片。参考数字名片对应的名片图片,录入人员可以修改现有数字名片的属性,也可以添加遗漏的名片属性。修改完成的数字名片将会被提交给数据服务器,由审核人员重新审核。如果名片图片不是名片,或者看不清楚,录入人员将名片标记为识别失败。录入人员开始录入时,首先输入名片中的电话号码(或邮箱,如果没有电话号码)。录入终端根据输入电话号码或者邮箱从数据服务器现有数字名片数据库中查询保存的数字名片。如果找到数字名片,录入终端将数据库中找到的数字名片填充到录入属性中,供录入人员修改,以提高录入的效率。8.返回识别结果。数据服务器将通过审核本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:朱胜
申请(专利权)人:北京友录在线科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术