【技术实现步骤摘要】
证件信息的获取方法及装置、存储介质、计算机设备
[0001]本专利技术涉及一种图像识别
,特别是涉及一种证件信息的获取方法及装置、存储介质、计算机设备。
技术介绍
[0002]随着业务办理的无人化、自动化发展,对于驾驶证等信息的录入已经从纯人工操作,如手动抄录证件信息,转为对证件图像的自动识别,从而得到准确的驾驶证信息,以便进行驾驶人员的信息录入及管理。
[0003]目前,现有对驾驶证信息进行识别方法通常是利用OCR技术识别图像后,从中提取与驾驶证上各图片区域所对应的文字,但是,这种单纯的利用OCR技术识别图像的方法,在针对模糊的驾驶证信息时,很容易将提取的信息遗漏,大大影响了证件信息获取的准确性,从而降低证件信息获取的效率。
技术实现思路
[0004]有鉴于此,本专利技术提供一种证件信息的获取方法及装置、存储介质、计算机设备,主要目的在于解决现有证件信息获取效率低的问题。
[0005]依据本专利技术一个方面,提供了一种证件信息的获取方法,包括:
[0006]获取证件图像信息,并 ...
【技术保护点】
【技术特征摘要】
1.一种证件信息的获取方法,其特征在于,包括:获取证件图像信息,并识别所述证件图像信息中的文本内容信息以及文本框位置信息;对所述文本内容信息、文本框位置信息进行量化处理,并利用已完成训练的分类模型对量化处理后的所述文本内容信息、所述文本框位置信息进行分类处理,所述分类模型在训练过程中根据不同模糊替换系数更新模糊训练样本集中的文本内容信息、或文本框位置信息;根据分类处理的结果将分类标记后的文本内容信息存储至具有不同证件特征的证件数据列表中。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取包含不同文本内容信息、文本框位置信息的模糊训练样本集;查找所述模糊训练样本集中与证件特征匹配的文本内容信息、文本框位置信息,标记为第一类标记,所述证件特征用于表征证件信息所共有的属性内容;查找所述模糊训练样本集中与非证件特征匹配的文本内容信息、文本框位置,基于自然语言识别技术以及预设聚类模型对所述文本内容信息、文本框位置信息进行聚类处理,对不同聚类结果标记为第二类标记,所述第二类标记包括姓名、地址、性别、年龄、证件号码、证件类别;利用分别标记为第一类标记、第二类标记的所述文本内容信息、所述文本框位置信息对选取的分类模型进行训练,所述选取的分类模型中确定有待根据不同模糊替换系数更新所述文本内容信息、所述文本框位置信息的替换迭代位置。3.根据权利要求1所述的方法,其特征在于,所述识别所述证件图像信息中的文本内容信息以及文本框位置信息包括:构建所述证件图像信息匹配的坐标系,并利用OCR技术划分具有本文内容的区域;标记所述文本内容信息的区域处于所述坐标系中的位置,确定文本框位置信息;结合所述OCR技术、自然语言处理技术识别所述证件图像信息中所述区域中的文本内容信息,并匹配标识所述文本内容信息所对应的文本框位置信息。4.根据权利要求3所述的方法,其特征在于,所述结合所述OCR技术、自然语言处理技术识别所述证件图像信息中所述区域中的文本内容信息包括:若结合所述OCR技术、自然语言处理技术从自然语言词库中匹配到所述证件图像信息中所述区域的文字词语,则将所述文字词语确定为所述区域中的文本内容信息;若结合所述OCR技术、自然语言处理技术从自然语言词库中未匹配到所述证件图像信息中所述区域的文字词语...
【专利技术属性】
技术研发人员:王德勋,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。