【技术实现步骤摘要】
证件验真方法和装置、服务器、存储介质
本专利技术实施例涉及计算机
,尤其涉及一种证件验真方法和装置、服务器、存储介质。
技术介绍
随着网络销售和网络金融的不断发展,对网络实名认证和网络资质验真的需求逐渐增加。现有技术中,通常采用人工或者光学字符识别(OpticalCharacterRecognition,OCR)技术识别比对的方式进行证件的验真,包括对身份证、营业执照或者护照等的验真。然而,人工验真过程慢且人工成本高;OCR识别比对的方式中,由于OCR本身的局限性,其识别出证件上的数据可能出现错字、多字和少字等问题,因此其准确率较低,无法满足实际业务需求。此外,证件还可以通过政府提供的接口进行验真,但是这些服务都是收费的,验真成本高。
技术实现思路
本专利技术实施例提供一种证件验真方法和装置、服务器、存储介质,以提高证件验真的准确率,并降低验真成本。第一方面,本专利技术实施例提供了一种证件验真方法,该方法包括:从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。第二方面,本专利技术实施例还提供了一种证件验真装置,该装置包括:第一信息源获取模块,用于从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;第二信息源获取模块,用于根据所 ...
【技术保护点】
一种证件验真方法,其特征在于,包括:从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。
【技术特征摘要】
1.一种证件验真方法,其特征在于,包括:从证件的图像中识别出第一信息源,其中,第一信息源包括所述证件的至少一种参数;根据所述证件的图像和预设途径获取第二信息源,其中,第二信息源包括所述证件的至少一种参数;将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值;依据所述相同类型的参数对应的可信度值计算所述证件的整体可信度值,依据所述整体可信度值确定所述证件的真伪。2.根据权利要求1所述的方法,其特征在于,所述证件包括营业执照;相应地,所述营业执照的至少一种参数包括名称、地址、法人和编号中的至少一种;第一信息源是利用光学字符识别技术从所述营业执照的图像中识别出来;第二信息源是利用所述营业执照中的二维码获取到。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:如果利用所述二维码无法获取第二信息源,则利用所述营业执照上的统一信用号和政府网站查询获取第三信息源;相应地,所述将第一信息源和第二信息源中相同类型的参数进行比较,计算得到所述相同类型的参数对应的可信度值,包括:将第一信息源和第三信息源中相同类型的参数进行可信度计算,得到所述相同类型的参数对应的可信度值。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:如果利用所述光学字符识别技术无法识别出第一信息源,则确定验真失败;如果无法识别出第二信息源和第三信息源,则确定验真失败。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:如果所述二维码对应的内容是网址,则判断所述网址与所述营业执照所属的省的预设网址是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则通过所述网址获取第二信息源;如果所述二维码对应的内容是营业执照数据,则判断所述营业执照数据与所述营业执照所属的省的预设数据模板是否匹配,若不匹配,则确定所述营业执照为伪造,若匹配,则将所述营业执照数据作为第二信息源。6.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述名称,则计算所述名称对应的可信度值,包括:对第一信息源和第二信息源中的名称分别进行分词,得到第一名称分词结果和第二名称分词结果;根据预设通用词库,去除第一名称分词结果和第二名称分词结果中的通用词,得到第一主题字符串和第二主题字符串;获取第一主题字符串和第二主题字符串的最长公共子串;确定第一主题字符串和第二主题字符串相比字符串长度小的主题字符串长度为目标名称长度,计算所述最长公共子串的长度与目标名称长度的比值,将所述比值作为所述名称对应的可信度值。7.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述地址,所述方法还包括:通过分词获取第一信息源和第二信息源的地址中各自的省市区数据;如果第一信息源的省市区数据与第二信息源的省市区数据不匹配,则确定所述营业执照为伪造。8.根据权利要求7所述的方法,其特征在于,计算所述地址对应的可信度值包括:获取第一信息源和第二信息源的地址中,除所述省市区数据之外的最长公共子串;确定第一信息源的地址和第二信息源的地址相比字符串长度小的地址长度为目标地址长度,计算所述最长公共子串的长度与目标地址长度的比值,将所述比值作为所述地址对应的可信度值。9.根据权利要求2所述的方法,其特征在于,如果所述相同类型的参数为所述法人,则计算所述法人对应的可信度值,包括:根据预设姓氏词库,匹配并比较第一信息源和第二信息源的法人中的姓氏;如果所述第一信息源和第二信息源的法人中的姓氏相同,则分别获取第一信息源和第二信息源的法人中除所述姓氏之外的字符串,作...
【专利技术属性】
技术研发人员:王刘强,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。