【技术实现步骤摘要】
信息识别方法及装置
本申请涉及光学字符识别领域,尤其涉及一种应用光学字符识别技术进行多维信息交叉验证的信息识别方法及装置。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)扫描衬底上的字符,通过检测暗、亮的模式确定字符的形状,然后用字符识别方法将形状翻译成计算机文字的过程。OCR可以应用于身份证件的审核或者电子卡信息的录入。这些身份证件或电子卡通常有姓名(可以是拼音或英文)、有效期、号码等多个维度的信息,而且这些信息是可以交叉验证的,也就是,多个维度的信息需保持对应关系。当其中某个维度的信息与其他维度的信息不能对应时,则意味着身份证件或电子卡可能是伪造的。在实现现有技术过程中,专利技术人发现现有技术中至少存在如下问题:现有的信息识别方法中,多个维度的信息被OCR设备输入到计算机后台进行信息之间对应关系的验证。计算机后台逐一处理每个维度的信息,整个信息识别占用的时间长。因此,需要提供一种信息识别占用时间少的技术方案。
技术实现思路
本申请实施例提供一种占用时间少的信息识别方法。具体的,一种信息识 ...
【技术保护点】
一种信息识别方法,其特征在于,包括:获取针对原始文件信息进行光学扫描得到的扫描信息;将所述扫描信息拆分为至少两个子信息;将所述至少两个子信息发送到不同的服务端,以通过各服务端分别对接收到的子信息进行识别;根据各服务端分别对接收到的子信息识别的结果,确定对原始文件信息扫描的结果。
【技术特征摘要】
1.一种信息识别方法,其特征在于,包括:获取针对原始文件信息进行光学扫描得到的扫描信息;将所述扫描信息拆分为至少两个子信息;将所述至少两个子信息发送到不同的服务端,以通过各服务端分别对接收到的子信息进行识别;根据各服务端分别对接收到的子信息识别的结果,确定对原始文件信息扫描的结果。2.如权利要求1所述的方法,其特征在于,将所述扫描信息拆分为至少两个子信息,具体包括:根据原始文件信息中字符聚簇的位置,将扫描信息拆分为至少两个子信息。3.如权利要求1所述的方法,其特征在于,将所述扫描信息拆分为至少两个的子信息,具体包括:根据原始文件信息中字符的类型,将扫描信息至少拆分为两个子信息。4.如权利要求1所述的方法,其特征在于,将所述至少两个子信息发送到不同的服务端,以通过各服务端分别对接收到的子信息进行识别,具体包括:将所述至少两个子信息发送到不同的服务端,以使服务端根据不同的算法对接收到的子信息进行识别;其中,服务端通过每个算法对子信息进行识别的结果包括通过、不通过、不确定;针对一个子信息,当至少一个算法的识别结果为不通过时,则确定识别该子信息错误;当所有算法的识别结果均为不确定时,则确定识别该子信息错误;当所有算法的识别结果中没有不通过,并且,所有算法的识别结果中至少有一个为通过时,则确定识别该子信息识别正确。5.如权利要求1所述的方法,其特征在于,所述方法还包括:当至少一个子信息识别错误时,再次针对原始文件信息进行光学扫描以便重新对识别错误的子信息进行识别。6.如权利要求1-5中任一项所述的方法,其特征在于,所述原始文件信息为身份证件信息或电子卡信息;至少两个子信息包括姓名信息和...
【专利技术属性】
技术研发人员:罗灿,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。